[La cooperació en joc: dues observacions]
Dues observacions sobre els experiments de Robert Axelrod als que em vaig referir en el post anterior:
La paradoxa Flood-Dresher. En el DdP iterat es dóna una curiosa situació que dóna lloc a l'anomenada paradoxa de Flood-Dresher, en referència a Merrill M. Flood i Melvin Dresher, els dos investigadors als que s'atribueix l'origen del joc del DdP (tot i que fou Albert W. Tucker qui li donà el nom i la interpretació). La paradoxa és la següent: si el joc consta, per exemple, de 100 iteracions, la darrera jugada funciona com un DdP simple i als participants els convé més trair, ja que obtenen una puntuació més alta i no tenen risc de represàlies perquè el joc s'acaba. Aleshores els jugadors poden pensar que la jugada 99a és realment la darrera significativa, ja que ambdós pretenen trair en el moviment 100. Però si el moviment 99 és l'últim, aleshores els dos jugadors haurien de trair, ja que tampoc ara hi ha represàlia possible (els dos jugadors trairan al moviment 100 independentment del que faci l'adversari al moviment 99). Aquest raonament pot ser estès repetidament fins al primer moviment, així que fins i tot en el DdP iterat no hauria de poder sorgir la cooperació: l'únic equilibri de Nash possible s'assoleix quan es traeix sempre.
Com se'n va sortir Axelrod d'aquest problema? Doncs bé, en el segon torneig va establir la longitud de les partides de forma probabilística. Cada enfrontament comprenia el mateix número de moviments, desconegut pels participants. Va dur a terme cinc repeticions dels enfrontaments, cadascuna d'elles amb un número diferent de moviments. Axelrod va prendre una probabilitat de 0.00346 d'acabar el joc en cada moviment (equivalent a un paràmetre de descompte w=0.99654). De fet, va executar els càlculs aleatoris abans del joc i va fixar el número de moviments de cada repetició (63, 77, 151, 156 i 308, el que fa una longitud mitjana de 151 moviments, una mica inferior als 200 de la primera versió). Com que els jugadors no podien saber amb exactitud quin moviment seria l'últim del joc, els resultats no estaven esbiaixats per estratègies que aprofitessin aquest efecte de fi-de-partida.
La fi del reialme de TIT FOR TAT? Llegeixo a la Wikipedia que en la competició celebrada en motiu del 20è aniversari del primer torneig d'Axelrod, l'estratègia més reeixida ja no fou TIT FOR TAT. Un grup de la Universitat de Southampton va presentar un grup de 60 estratègies que operaven conxorxades, de manera que cooperaven entre si per a que una d'elles assolís la màxima puntuació. Les estratègies del grup podien reconèixer-se mútuament gràcies a un patró ocult als primers cinc a deu moviments. Un cop identificat que el contrincant era un membre del grup, una d'elles sempre cooperava mentre que l'altra sempre traïa, de manera que la puntuació de la segona es maximitzava. Pel contrari, si detectaven que l'adversari no pertanyia al grup, traïen sistemàticament per a minimitzar la puntuació del contrincant. Molt abans de dur-se a terme aquesta nova competició, Richard Dawkins ja havia apuntat a El gen egoista la possibilitat de que estratègies aliades resultessin victorioses en cas de que fossin permeses.
Significa això que hem de revisar totes les conclusions que vam veure en el post anterior? Sense haver-hi meditat profundament, crec que la clau està en la simulació ecològica, la que millor caracteritza l'evolució per selecció natural. Si bé aquest grup d'estratègies sortí victoriós, no crec que aquesta estratègia sigui estable a llarg termini, quan la mida de la població en la propera contesa és proporcional a l'èxit assolit en aquesta. Si bé l'estratègia guanyadora tindrà una població molt considerable, totes aquelles que li servien de recolzament per a aconseguir el triomf tindran una presència molt minvada, de manera que cada cop li serà més difícil trobar aliats disposats a immolar-se per al seu profit i —només especulo— TIT FOR TAT tornaria a sortit airosa.
La paradoxa Flood-Dresher. En el DdP iterat es dóna una curiosa situació que dóna lloc a l'anomenada paradoxa de Flood-Dresher, en referència a Merrill M. Flood i Melvin Dresher, els dos investigadors als que s'atribueix l'origen del joc del DdP (tot i que fou Albert W. Tucker qui li donà el nom i la interpretació). La paradoxa és la següent: si el joc consta, per exemple, de 100 iteracions, la darrera jugada funciona com un DdP simple i als participants els convé més trair, ja que obtenen una puntuació més alta i no tenen risc de represàlies perquè el joc s'acaba. Aleshores els jugadors poden pensar que la jugada 99a és realment la darrera significativa, ja que ambdós pretenen trair en el moviment 100. Però si el moviment 99 és l'últim, aleshores els dos jugadors haurien de trair, ja que tampoc ara hi ha represàlia possible (els dos jugadors trairan al moviment 100 independentment del que faci l'adversari al moviment 99). Aquest raonament pot ser estès repetidament fins al primer moviment, així que fins i tot en el DdP iterat no hauria de poder sorgir la cooperació: l'únic equilibri de Nash possible s'assoleix quan es traeix sempre.
Com se'n va sortir Axelrod d'aquest problema? Doncs bé, en el segon torneig va establir la longitud de les partides de forma probabilística. Cada enfrontament comprenia el mateix número de moviments, desconegut pels participants. Va dur a terme cinc repeticions dels enfrontaments, cadascuna d'elles amb un número diferent de moviments. Axelrod va prendre una probabilitat de 0.00346 d'acabar el joc en cada moviment (equivalent a un paràmetre de descompte w=0.99654). De fet, va executar els càlculs aleatoris abans del joc i va fixar el número de moviments de cada repetició (63, 77, 151, 156 i 308, el que fa una longitud mitjana de 151 moviments, una mica inferior als 200 de la primera versió). Com que els jugadors no podien saber amb exactitud quin moviment seria l'últim del joc, els resultats no estaven esbiaixats per estratègies que aprofitessin aquest efecte de fi-de-partida.
La fi del reialme de TIT FOR TAT? Llegeixo a la Wikipedia que en la competició celebrada en motiu del 20è aniversari del primer torneig d'Axelrod, l'estratègia més reeixida ja no fou TIT FOR TAT. Un grup de la Universitat de Southampton va presentar un grup de 60 estratègies que operaven conxorxades, de manera que cooperaven entre si per a que una d'elles assolís la màxima puntuació. Les estratègies del grup podien reconèixer-se mútuament gràcies a un patró ocult als primers cinc a deu moviments. Un cop identificat que el contrincant era un membre del grup, una d'elles sempre cooperava mentre que l'altra sempre traïa, de manera que la puntuació de la segona es maximitzava. Pel contrari, si detectaven que l'adversari no pertanyia al grup, traïen sistemàticament per a minimitzar la puntuació del contrincant. Molt abans de dur-se a terme aquesta nova competició, Richard Dawkins ja havia apuntat a El gen egoista la possibilitat de que estratègies aliades resultessin victorioses en cas de que fossin permeses.
Significa això que hem de revisar totes les conclusions que vam veure en el post anterior? Sense haver-hi meditat profundament, crec que la clau està en la simulació ecològica, la que millor caracteritza l'evolució per selecció natural. Si bé aquest grup d'estratègies sortí victoriós, no crec que aquesta estratègia sigui estable a llarg termini, quan la mida de la població en la propera contesa és proporcional a l'èxit assolit en aquesta. Si bé l'estratègia guanyadora tindrà una població molt considerable, totes aquelles que li servien de recolzament per a aconseguir el triomf tindran una presència molt minvada, de manera que cada cop li serà més difícil trobar aliats disposats a immolar-se per al seu profit i —només especulo— TIT FOR TAT tornaria a sortit airosa.