Dilema do Prisioneiro
Na Galipedia, a wikipedia en galego.
O Dilema do Prisioneiro e un exemplo claro pero atípico dun problema de suma non nula. Nste problema da Teoría de Xogos, como en otros moitos, suponse que cada xogador, de forma independente, trata de maximizar a súa propia vantaxe sen importar os resultados para o outro xogador. As técnicas de análise da teoría de xogo estándar, por exemplo determinar o Equilibrio de Nash poden levar a cada xogador a escoller traicionar o outro, pero curiosamente cada xogador obtería un mellor resultado se colaborasen. Desgraciadamente para os xogadores, cada prisioneiro está incentivado individualmente para defraudar o outro, incluso tras prometer colaborar. Iste é o punto clave do dilema.
No dilema do prisioneiro iterado a cooperación pode obterse como un resultado de equilibrio. Aquí xógase repetidamente polo que, cando se repíte o xogo, ofrécese a cada xogador a oportunidade de castigar o outro pola non cooperación nos xogos anteriores. Asi, o incentivo para defraudar pode verse superado pola ameaza de castigo, que conduce un resultado mellor, cooperativo.
Índice |
[editar] O dilema do prisioneiro clásico
A enunciación do dilema do prisioneiro clásico é:
- A policía detén a dous sospeitosos. Non teñen probas suficientes e dependen dos testimonios dos detidos para impoñer un castigo. Séparan os prisioneiros, polo que non teñen testimonio conxunto e descoñecen que fará o compañeiro. Si o prisioneiro A delata ao prisioneiro B, o xogador A será condeado a 2 anos e o B a 10 anos. Se o compañeiro B delata ao compañeiro A, o último será condeado a 10 anos mentres que o delator a 2 anos de cárcere. Si os prisioneiros calan, serán condeados a 5 anos de prisión. Se ambos falan, os dous serán condeados a pena máxima, 10 anos.
Supoñamos que cada prisioneiro actúa de forma egoísta é a única meta e minimizar a súa estancia na cárcere. Cada prisioneiro ten dúas opcións: cooperar co cómplice ou traicionalo. O resultado de cada elección depende da elección do outro xogador. Desgraciadamente, están illados un do outro e non saben como actuará. E incluso tendo contacto con él, non pode estar seguro de que pode confiar en él.
Se esperas que o teu compañeiro colabore contigo, a elección óptima para ti sería delatar, condenandoo a él a 10 anos mentres que a tua pena sería soamente de 2 anos. Sen embargo, o outro xogador co meso razoamento tenderá a confesar, polo que ambolos dous serían condeados a pena máxima, 10 anos.
Confesar é a estratexía dominante para os dous actores individuales, xa que supón a pena mínima. Sin embargo isto conduce a un resultado distinto o esperado, pois se ambos confesan son condeados a 10 anos. Aquí encontrase o punto clave do dilema. o resultado das interaccións individuais produce un resultado que non é óptimo no sentido de Pareto; existe unha situación tal que a utilidade duns dos detidos podría mellorar (incluso dos dous) sen que isto implique un empeoramiento para o resto. Noutras pañabras, o resultado no cal ambos detidos no confesan domina paretianamente o resultado no cal os dous excollen confesar.
Dende a perspectiva do interese óptimo do grupo, o reusltado correcto sería que ambolos dous cooperasen e calase xa que reduciría o tempo total de condena que si se delatasen. Calquera outra decisión sería peor para os prisioneiros si se evalúa en conxunto. A pesar de isto, se seguen os seus intereses egoístas, cada un dos prisioneiros recibirá unha sentenza peor que si non colaborasen.
No dilema do prisioneiro iterado, onde se póde castigar ao compañeiro por confesar, entón o reusltado cooperativo pode manterse. neste xogo, si o teu compañeiro te traizoa e confesa unha vez, podes castigalo traizoandoo ti a próxima vez. Asi, a opción iterada ofrece a opción de castigo ausente na teoría clásica do xogo.
[editar] Unha variante sinxela
O científico cognitivo Douglas Hofstadter expuso que o dilema do prisioneiro atópase moitas veces na vida corrente, máis doados de entender se están presentados coma un xogo ou intercambio. Un exemplo ilustrativo disto é candos dúas persoas intercambian dúas bolsas cerradas co acordo de que unha conten os cartos mentre ca outra a mercancía comprada. Cada xogador pode escoller ser fiel o acordo e poñer na bolsa o estipulado no acordo ou, pola contra,enganar e ofrecer a bolsa vacía. Nesta variante, o contrario que no dilema do prisioneiro clásico, enganar sempre é a mellor opción.
[editar] Matriz de pagos do dilema
No mesmo artigo, Hofstadter observou ca matriz de pagos do dilema do prisioneiro pode, de feito, enunciarse de moitas formas sempre que manteña iste axioma:
- T > R > C > P
Onde T é a tentación para traizoar[é dicir, o que obtes cando desertas e o outro xogador coopera); R é aa recompensa da cooperación mutua; C é o castigo pola traizón mútua; e P é a paga do primo (é dicir, o que obtés se cooperas e o outro xogador deserta).
(É frecuente tamén (T + C)/2 < R, e isto requierese no caso iterado.)
Segindo este principio, e simplicando o dilema do prisioneiro o escenario do cambio de bolsas do xogo anterior, obteremos a seguinte matriz de pagos canónica para o dilema do prisioneiro, isto é, a que sóese mostrar na literatura sobre iste tema:
| Cooperar | Desertar | |
|---|---|---|
| Cooperar | 3, 3 | -5, 5 |
| Desertar | 5, -5 | -1, -1 |
En terminoloxía "ganancia-ganancia" a táboa sería similar a esta:
| Cooperar | Desertar | |
|---|---|---|
| Cooperar | ganancia - ganancia | pérdida sustancial - ganancia sustancial |
| Desertar | ganancia sustancial - pérdida sustancial | pérdida - pérdida |
[editar] Referencias
Hofstadter, Douglas R. (1985) The Prisoner's Dilemma Computer Tournaments and the Evolution of Cooperation Ch.29 en Metamagical Themas: questing for the essence of mind and pattern (ISBN 0465045669).

