dissabte, d’octubre 25, 2008

[La cooperació en joc: dues observacions]

Dues observacions sobre els experiments de Robert Axelrod als que em vaig referir en el post anterior:


La paradoxa Flood-Dresher. En el DdP iterat es dóna una curiosa situació que dóna lloc a l'anomenada paradoxa de Flood-Dresher, en referència a Merrill M. Flood i Melvin Dresher, els dos investigadors als que s'atribueix l'origen del joc del DdP (tot i que fou Albert W. Tucker qui li donà el nom i la interpretació). La paradoxa és la següent: si el joc consta, per exemple, de 100 iteracions, la darrera jugada funciona com un DdP simple i als participants els convé més trair, ja que obtenen una puntuació més alta i no tenen risc de represàlies perquè el joc s'acaba. Aleshores els jugadors poden pensar que la jugada 99a és realment la darrera significativa, ja que ambdós pretenen trair en el moviment 100. Però si el moviment 99 és l'últim, aleshores els dos jugadors haurien de trair, ja que tampoc ara hi ha represàlia possible (els dos jugadors trairan al moviment 100 independentment del que faci l'adversari al moviment 99). Aquest raonament pot ser estès repetidament fins al primer moviment, així que fins i tot en el DdP iterat no hauria de poder sorgir la cooperació: l'únic equilibri de Nash possible s'assoleix quan es traeix sempre.

Com se'n va sortir Axelrod d'aquest problema? Doncs bé, en el segon torneig va establir la longitud de les partides de forma probabilística. Cada enfrontament comprenia el mateix número de moviments, desconegut pels participants. Va dur a terme cinc repeticions dels enfrontaments, cadascuna d'elles amb un número diferent de moviments. Axelrod va prendre una probabilitat de 0.00346 d'acabar el joc en cada moviment (equivalent a un paràmetre de descompte w=0.99654). De fet, va executar els càlculs aleatoris abans del joc i va fixar el número de moviments de cada repetició (63, 77, 151, 156 i 308, el que fa una longitud mitjana de 151 moviments, una mica inferior als 200 de la primera versió). Com que els jugadors no podien saber amb exactitud quin moviment seria l'últim del joc, els resultats no estaven esbiaixats per estratègies que aprofitessin aquest efecte de fi-de-partida.


La fi del reialme de TIT FOR TAT? Llegeixo a la Wikipedia que en la competició celebrada en motiu del 20è aniversari del primer torneig d'Axelrod, l'estratègia més reeixida ja no fou TIT FOR TAT. Un grup de la Universitat de Southampton va presentar un grup de 60 estratègies que operaven conxorxades, de manera que cooperaven entre si per a que una d'elles assolís la màxima puntuació. Les estratègies del grup podien reconèixer-se mútuament gràcies a un patró ocult als primers cinc a deu moviments. Un cop identificat que el contrincant era un membre del grup, una d'elles sempre cooperava mentre que l'altra sempre traïa, de manera que la puntuació de la segona es maximitzava. Pel contrari, si detectaven que l'adversari no pertanyia al grup, traïen sistemàticament per a minimitzar la puntuació del contrincant. Molt abans de dur-se a terme aquesta nova competició, Richard Dawkins ja havia apuntat a El gen egoista la possibilitat de que estratègies aliades resultessin victorioses en cas de que fossin permeses.

Significa això que hem de revisar totes les conclusions que vam veure en el post anterior? Sense haver-hi meditat profundament, crec que la clau està en la simulació ecològica, la que millor caracteritza l'evolució per selecció natural. Si bé aquest grup d'estratègies sortí victoriós, no crec que aquesta estratègia sigui estable a llarg termini, quan la mida de la població en la propera contesa és proporcional a l'èxit assolit en aquesta. Si bé l'estratègia guanyadora tindrà una població molt considerable, totes aquelles que li servien de recolzament per a aconseguir el triomf tindran una presència molt minvada, de manera que cada cop li serà més difícil trobar aliats disposats a immolar-se per al seu profit i —només especulo— TIT FOR TAT tornaria a sortit airosa.

dissabte, d’octubre 18, 2008

La cooperació en joc

Poc després de que dos dels vaixells destinats a evacuar l'amenaçada població de Gotham City salpin, el Joker comunica al passatge que ha col·locat explosius a les bodegues i que cadascun d'ells disposa d'un detonador amb el que poden fer explotar l'altre vaixell. Ambdós vaixells no poden comunicar-se entre si, així que l'única opció de supervivència és cooperar esperant que l'altre també ho faci, o bé ser el primer en prémer el botó del detonador.

Aquesta és la darrera recreació que he vist del cèlebre dilema del presoner (DdP), i forma part de The Dark Knight, la (fluixa) darrera seqüela de Batman. La formulació del joc —que té aplicacions en els àmbits de l'economia, les ciències polítiques, la sociologia, la psicologia i la biologia— podria ser aquesta (copio de la Wikipedia):


La policia arresta dos sospitosos. No hi ha proves suficients per condemnar-los i, després d'haver-los separat, els interroga i els ofereix el mateix tracte. Si un confessa i el seu còmplice no, el còmplice serà condemnat a la pena total, deu anys, i el primer serà alliberat. Si un calla i el còmplice confessa, el primer rebrà aquesta pena i serà el còmplice que surti lliure. Si ambdós romanen callats, tot el que podran fer serà tancar-los durant sis mesos per un càrrec menor. Si ambdós confessen, ambdós seran condemnats a sis anys.

Els valors numèrics concrets no importen sempre que es mantingui l'ordenació. El problema pot expressar-se en forma matricial de la següent manera:



On s'ha de complir que T>R>P>S i R>(T+S)/2. Si només es juga una vegada (DdP simple), la solució només pot ser una: si un dels presoners pensa que l'altre cooperarà, li surt més rentable trair-lo (T>R). Si pel contrari, pensa que serà traït, també li compensa la traïció (P>S). Per tant, faci el que faci el seu còmplice, la traïció és la sortida òptima. És per això que Christopher Nolan ha d'apel·lar als sentiments morals en el film, ja que la situació no deixaria una altra sortida que detonar l'altre vaixell si s'apliqués purament la lògica. I és per aquesta raó també que John von Neumann, un dels científics més eminents del segle XX, creador de la Teoria de Jocs i partícep al Projecte Manhattan que va desenvolupar la primera bomba atòmica, defensava un atac nuclear preventiu contra la Unió Soviètica. Són famoses les seves paraules a la revista Life: «En el caso de los rusos, no hay que decidir si se les ataca, sino cuándo. [...] Si me propone usted bombardearles mañana, yo le contesto, ¿por qué no hoy? Si dice usted que hoy a las cinco de la tarde, yo le digo, ¿por qué no a la una?». Aquesta bel·licosa actitud s'explica per la interpretació que feia de la Guerra Freda en termes d'un DdP.

Molt més interessant és la situació en el que els jugadors repeteixen el joc successivament, guardant memòria dels jocs anteriors. Això és el que es coneix com a DdP iterat. Robert Axelrod, professor de Ciències Polítiques a la Universitat de Michigan, va convocar el 1980 experts en Teoria de Jocs de diferents àrees per a que proposessin estratègies per a un torneig de DdP iterat per ordinador. El sistema enfrontava totes les estratègies reportades (incloent-ne una purament aleatòria) contra totes, i imposava algunes restriccions més: la més important, la de considerar que, si bé el moviment present sempre té menys pes que l'anterior (el que es pot representar amb un paràmetre de descompte w aplicat als guanys, on 1>w>0), aquest factor és prou alt com per fer que cap estratègia òptima sigui independent de l'estratègia utilitzada pel contrincant.

Doncs bé, sorprenentment, l'estratègia guanyadora en ambdues conteses fou la més simple de totes les presentades (5 línies de codi FORTRAN), la proposada pel professor Anatol Rapoport de la Universitat de Toronto i denominada TIT FOR TAT. Aquesta estratègia és molt fàcil d'explicar: coopera en el primer moviment i a partir d'aquí fa en cada jugada el que el seu contrincant ha fet en la jugada anterior. És a dir, és l'estratègia de l'«ull per ull» o de «tornar la moneda». És fàcil veure que per la seva estructura, aquesta estratègia no pot guanyar cap enfrontament: com a molt farà tants punts com el seu adversari o menys. On rau, aleshores, el secret del seu èxit? Doncs en que obté bones puntuacions contra qualsevol tipus d'adversari. Altres estratègies aconseguien explotar les febleses d'alguns contrincants, però eren a la vegada clarament derrotades per altres; mentre que TIT FOR TAT és inexpugnable. Axelrod va detectar les característiques de les estratègies triomfadores: són amables (no traeixen sense causa), provocables (prenen represàlies quan són traïdes), perdonen (tornen a cooperar si l'oponent deixa de trair) i els manca enveja (no juguen pensant en obtenir millor puntuació que l'adversari). TIT FOR TAT reunia aquestes virtuts millor que qualsevol altra. Aquest anàlisi va ser publicar per Axelrod en quatre importants articles científics (un d'ells a la revista Science) i el 1984 en forma de llibre: The Evolution of Cooperation.

El que resulta realment interessant d'aquest experiment són les seves aplicacions biològiques. Molts científics havien observat relacions de cooperació a la natura que no acabaven de poder explicar amb la teoria de la selecció natural. La pregunta que calia respondre era: sota quines condicions pot emergir la cooperació en un món d'egoistes sense autoritat central?

L'aplicació de la Teoria de Jocs a l'àmbit de la teoria evolutiva va sistematitzar-se també aquells anys. La primera obra que presentava una visió de conjunt de la teoria fou Evolution and the Theory of Games (1982), de John Maynard Smith. Maynard Smith va introduir un concepte clau, el d'Estratègia Evolutiva Estable (ESS, de les sigles en anglès). Una ESS és aquella que, si tots els membres d'una població l'adopten, aleshores cap estratègia mutant pot envair-la si només hi intervé la selecció natural. En aquest assaig es partia del model més bàsic, el joc del Falcó-Colom [Hawk-Dove game] i a partir d'ell s'hi anava afegint complexitat, tant conceptual com matemàtica: interacció d'un individu amb un grup, guerra de desgast [war of attrition], jocs amb models genètics, sistemes d'aprenentatge, estratègies mixtes, jocs asimètrics, influència de variables com la propietat del recurs en joc, la transferència d'informació, el compromís, la territorialitat...

D'acord amb la definició de Maynard Smith i els resultats d'Axelrod, TIT FOR TAT és una ESS. Axelrod demostrà no només que TIT FOR TAT no podia ser envaïda per cap altra estratègia, sinó que ella mateixa podia envair qualsevol altra estratègia col·lectivament estable (com la de «sempre trair») sempre que fós una petita comunitat d'individus mutants la que s'infiltrés, i no només un de sol. Un experiment molt revelador que va dur a terme fou la d'emular l'ecologia del torneig: les poblacions representatives de cada estratègia en la següent ronda eren proporcionals a l'èxit que obtenien en la present. Aquest model, que simula l'evolució de les poblacions per selecció natural, tornava a tenir TIT FOR TAT com a clara guanyadora, el que refermava la seva estabilitat al llarg del temps.

El treball d'Axelrod es va convertir immediatament en objecte d'estudi i ha generat una àmplia bibliografia. Com acostuma a passar, les solucions simples i espectaculars atreuen a molta gent, i els seus resultats van ser aplicats a situacions molt diverses, de vegades simplificant excessivament les condicions per aplicar el model (el mateix Axelrod la utilitza per explicar la situació de viu-i-deixa-viure a la guerra de trinxeres durant la Primera Guerra Mundial). Així, TIT FOR TAT es va convertir en el model capaç d'explicar l'aparició de la cooperació en les complexes interaccions socials entre humans i fins i tot l'evolució de la cooperació social en tota la naturalesa, el que evidentment és fer-ne un gra massa. Una conseqüència interessant fou la de servir de base a un grup d'intel·lectuals que, com Peter Singer, reclamaven a les posicions polítiques d'esquerra una reconciliació amb el darwinisme, reticent des de que Marx postulà que «l'essència de l'home [...] consisteix en el conjunt de les relacions socials» i des de que un interessat darwinisme social servís de justificació de les desigualtats socials. Els liberals també poden portar l'aigua al seu molí afirmant que es pot reduir el paper de l'Estat perquè la cooperació sorgirà de manera natural entre els individus, tot i que Axelrod fa algunes observacions en termes de que l'autoritat pot intervenir en el joc alterant els valors dels guanys en la matriu (per exemple, augmentant la pena per traïció) i transformar el joc en quelcom que ja no és més un DdP. Com observa Roger Arnold, del Mises Institute, Axelrod sembla justificar la intervenció estatal tot i que entra en conflicte amb la troballa que ell mateix acaba de fer: que la cooperació pot sorgir per selecció natural en un ambient no-coercitiu. Això, és clar, sempre que es donin les condicions que s'imposen al joc, una de les quals també té una lectura política: per a que la cooperació emergeixi de forma natural, el pes de les interaccions futures ha de ser prou important, és a dir, els dos adversaris han de saber que s'enfrontaran repetidament en el futur i que les decisions que prenguin ara tindran conseqüències. Això afavoreix evidentment un model de societats obertes i interrelacionades.

Axelrod manté una web on pot descarregar-se el programari del seu torneig. Al seu llibre li seguí una seqüela, The Complexity of Cooperation (1997), on aprofundeix en les seves tesis. Com a curiositat, John Maynard Smith va participar al segon torneig presentant una variació de TIT FOR TAT menys estable, que només assolí la vint-i-quatrena posició.

dimecres, d’octubre 15, 2008

[...]

«Creo en la libertad de mercado, pero en la vida hay coyunturas excepcionales. Se puede hacer un paréntesis en la economía de libre mercado.»
Gerardo Díaz Ferrán, president de la CEOE


«Que nadie espere que el precio de la vivienda baje un 30 o un 40% porque, antes de eso, se la regalo al banco. [Si se reactiva el mercado] podríamos recuperar la inversión para reinvertirla en el programa de viviendas de protección oficial que propone el Gobierno»
Guillermo Chicote, president de l'Asociación de Promotores y Constructores de España (APCE)


«[El Pacto de Estabilidad y Crecimiento se aplicará teniendo en cuenta] las circunstancias excepcionales en las que nos encontramos.»
Nicolas Sarzozy, President de la República Francesa


«[El Gobierno ha decidido] crear un fondo con cargo al tesoro de 30.000 millones de euros, ampliable a 50.000*, para comprar activos sanos de entidades financieras. [...] Este fondo se apoyará en asumir activos de calidad.»
José Luis Rodríguez Zapatero, President del Govern d'Espanya

[* 15% - 25% dels pressupostos generals de l'Estat per al 2008]







M'agradaria agafar un guix i poder traçar la línia de «fins aquí va arribar la riuada», però em temo que ens queden encara molts mesos d'escoltar nicieses com aquestes.

diumenge, d’octubre 12, 2008

La censura de premsa al primer franquisme

La continuació de la història de les relacions entre la premsa espanyola i el poder polític ha estat estudiada també per Justino Sinova i publicada a La censura de prensa durante el franquismo (1989). El títol és enganyós, ja que només comprèn el període 1936-1951 i no pas tot el franquisme.

El primer que cal notar és que ara ja no té sentit parlar de les limitacions a la llibertat de premsa. La política de premsa del franquisme no va suposar només un increment quantitatiu de les restriccions a l'exercici de la lliure informació, sinó un canvi qualitatiu de la funció del periodisme. Sinova cita les formulacions teòriques del falangista Maximiano García Venero, que sintetitzen molt bé les bases ideològiques sobre les que s'havia de sustentar la nova política de premsa a Espanya:
El periódico y el periodista servirán al Estado. [...] A un Estado fuerte corresponde una Prensa fuerte. No puede existir fortaleza en la Prensa si esta obedece a otros móviles, políticos o particulares, diferentes a los que inspiran el mismo Estado.

Així doncs, com diu Sinova: «el periodismo será concebido como una actividad de servicio al Estado; el periódico, como un instrumento de acción política; y el periodista, como un trabajador más de la Administración». Es discuteix de vegades si el règim de Franco pot ser qualificat de totalitari, de feixista o si s'assemblà més als règims autoritaris cabdillistes d'Amèrica Llatina; doncs bé, com veurem, pel que fa a la política de premsa no pot haver cap dubte: fou netament totalitari.

La llei que regí durant tot el primer franquisme fou redactada el 23 d'abril de 1938 —durant la guerra i per tant, en unes circumstàncies extraordinàries— per José Antonio Giménez Arnau per encàrrec de Ramón Serrano Súñer, aleshores ministre de Governació, i, tot i que fou dictada amb caràcter provisional, va estar vigent fins la «Llei Fraga» de 1966. Amb tals patrocinadors, no és d'estranyar que el redactat seguís les passes de la legislació de Mussolini i Goebbels. El seu article segon deixava ben clar les cinc funcions que corresponien a l'Estat per a dur a terme la seva «facultat ordenadora» sobre la Premsa:
  1. La regulació del número i extensió de les publicacions periòdiques
  2. La intervenció en la designació del personal directiu
  3. La reglamentació de la professió del periodista
  4. La vigilància de l'activitat de la Premsa
  5. La censura

Com observa Sinova, «el Estado se convertirá en el dueño de toda la actividad informativa: el que decidía cuántos periódicos podían ser publicados, el que señalaba lo que se podía decir y cómo, el que ordenaba lo que había que difundir en determinados momentos, el que ponía el límite a la labor de crítica, el que facultaba a las personas para ejercer el periodismo, el que sancionaba, en fin, cualquier mínima desviación de la norma impuesta». Les empreses periodístiques van continuar essent privades, però amb un director imposat pel Règim, el que de vegades originà penosos incidents amb els amos del diari (casos Pradera a Ya, Losada a ABC, Galinsoga a La Vanguardia...). Els periodistes foren depurats —la majoria dels que havien exercit al bàndol republicà durant la guerra foren condemnats a mort o a cadena perpètua— i s'examinà la seva conducta en relació amb el Moviment Nacional.

El Règim exercia la seva facultat de control de la informació principalment a través de consignes diàries d'obligat compliment sota pena de dures sancions i a través també d'una rigorosíssima censura. Sinova distingeix quatre etapes diferents, connectades amb els diferents titulars del ministeri de Governació. La primera, durant la primera meitat de la Guerra Civil (18 de juliol de 1936 a 31 de gener de 1938), va estar caracteritzada per l'autoritat militar: els organismes dedicats a controlar la premsa (pura propaganda de guerra en aquells moments) pertanyien a l'exèrcit i exercien les seves tasques al costat del quarter general de Franco. A aquesta etapa la seguí una (31 de gener de 1938 a 20 de maig de 1941) d'aproximació al nazisme i al feixisme comandada per Serrano Súñer, en la que es promulgà la llei d'abril de 1938 a la que ens hem referit. A la tercera etapa (20 de maig de 1941 a 27 de juliol de 1945) fou la Falange la que controlà la premsa i concedí alguns privilegis als seus òrgans de difusió. A la darrera etapa (27 de juliol de 1945 a 19 de juliol de 1951), tàcticament iniciada veient el rumb que prenia la Segona Guerra Mundial, el Règim intentà mostrar una imatge allunyada del totalitarisme i apropar-se a les democràcies occidentals, així que foren els sectors catòlics els que es feren càrrec del control de la informació.

La censura era d'una meticulositat aclaparadora i donava indicacions fins a extrems grotescos: temes i arguments sobre els que s'havia d'informar obligatòriament i sobre els que estava prohibit, discursos i notícies que havien de dur un comentari i els que no, paraules que havien de sortir en el titular i en el cos de la notícia, to general de l'escrit, ubicació de la notícia al diari o a la pàgina, columnat, tipus de lletra i si s'havien d'inserir fotografies... L'exaltació i adulació contínua de Franco fou una obsessió per al Règim, que farcia els diaris de ridículs ditirambes en el més pur culte a la personalitat estalinista, i que pel contrari suprimia qualsevol referència als ministres i a altres autoritats, no fos cas que poguessin fer-li ombra. Per a fer efectiu aquest control, les Delegacions Provincials elaboraven cada dia uns Fulls d'Inspecció en els que donaven compte al ministeri del compliment de les consignes per part del diaris sota llurs jurisdiccions.

En els dos posts anteriors vam veure les limitacions que va viure la premsa espanyola durant la Segona República, desconegudes per molts i que cal denunciar. Però malgrat les mancances i arbitrarietats que es patiren, no hi ha comparació possible: la situació durant la dictadura franquista fou infinitament pitjor i no té parió amb cap altre període anterior. El Règim s'apoderà completament dels mitjans de comunicació, convertint-los en instruments de propaganda durant dècades i sense deixar-los ni una escletxa de llibertat. Acabo citant Sinova: «Increíble o no, lo que se cuenta aquí sucedió. Y es bueno conocerlo. Sobre todo, para que no se repita».