Subject
Dilema tahanan (DT) adalah contoh kanonis dari sebuah permainan yang dianalisis dalam teori permainan yang memperlihatkan mengapa dua individu mungkin tidak akan bekerja sama, bahkan jika demi kebaikan mereka sendiri untuk melakukan hal tersebut. Ia diciptakan pada mulanya oleh Merrill Flood dan Melvin Dresher yang bekerja di RAND pada tahun 1950. Albert W. Tucker memformulasikan permainan tersebut dengan imbalan hukuman penjara dan menamakannya dengan "dilema tahanan" (Poundstone, 1992), seperti cerita berikut: Dua anggota geng kriminal tertangkap dan dipenjara. Setiap tahanan berada dalam ruangan tersendiri tanpa bisa saling berbicara atau menukar pesan. Polisi mengakui bahwa mereka tidak memiliki cukup bukti untuk menghukum pasangan tersebut. Mereka berencana menghukum keduanya satu tahun penjara dengan dakwaan terendah. Bersamaan dengan itu, polisi memberikan setiap tahanan sebuah penawaran Faustian. Jika salah satu dari mereka bersaksi melawan teman mereka, ia akan dibebaskan sedangkan temannya akan dihukum tiga tahun penjara. Oh, ya, ada udang di balik batu ... Jika kedua tahanan saling bersaksi, keduanya akan dihukum dua tahun penjara. Dalam versi klasik permainan ini, kolaborasi didominasi oleh pengkhianatan; jika seorang tahanan memilih untuk tetap diam, maka tahanan lain mendapatkan balasan lebih baik dengan berkhianat daripada tetap diam (tanpa dihukum bukannya satu tahun penjara), tetapi jika seorang tahanan memilih untuk berkhianat, maka tahanan lain masih tetap mendapatkan imbalan yang cukup baik dengan berkhianat juga (dua tahun bukannya tiga tahun penjara). Karena berkhianat selalu memberikan imbalan lebih daripada berkooperasi, semua tahanan yang sepenuhnya rasional egois akan mengkhianati yang lainnya, dan satu-satunya hasil dari dua tahanan rasional egois adalah saling mengkhianati. Bagian yang menarik dari hasil ini adalah mengejar imbalan individu secara logika mengarah pada kedua tahanan berkhianat, tetapi mereka akan mendapatkan imbalan yang lebih baik jika mereka saling berkooperasi. Dalam dunia nyata, manusia memperlihatkan bias sistematis terhadap perilaku kooperatif dalam permainan ini dan permainan yang mirip lainnya, lebih dari apa yang diprediksi oleh model sederhana dari aksi "rasional" egoistis. Ada juga versi "iteratif" dari permainan ini, di mana permainan klasik dimainkan terus menerus terhadap tahanan yang sama, dan akibatnya, kedua tahanan terus menerus memiliki kesempatan untuk menghukum yang lain berdasarkan pilihan mereka sebelumnya. Jika jumlah permainan yang dilakukan diketahui oleh pemain, maka (dengan induksi mundur) duah tahanan yang sepenuhnya rasional akan saling mengkhianati berulang kali, dengan alasan yang sama pada versi klasiknya. Dalam permainan yang panjang dan tak terbatas tidak ada strategi pasti yang optimal, dan pertandingan Dilema Tahanan telah dilakukan untuk mengadu dan menguji algoritme-algoritme. Dalam penggunaan sehari-hari, label "dilema tahanan" bisa diterapkan pada situasi yang tidak harus benar-benar sama dengan kriteria formal dari permainan klasik atau iteratif: misalnya, permainan dengan dua entitas yang bisa mendapatkan keuntungan dari berkooperasi atau menderita dari kegagalan berkooperasi, tetapi menemukannya sulit atau membutuhkan biaya tinggi, tidak harus sesuatu yang mustahil, untuk mengkoordinasi aktivitas mereka untuk berkooperasi. Source: Wikipedia (id)
Subject -