La investigación de Axelrod o cómo demostrar que cooperar es ganar

Claudio Drapkin > Mi Blog > Claudio Drapkin > La investigación de Axelrod o cómo demostrar que cooperar es ganar

La investigación de Axelrod o cómo demostrar que cooperar es ganar

  • Comentarios 0
  • Publicado por: Claudio Drapkin

Hace ya unos años escribí sobre el experimento de Stanley Milgram que, intrigado por la obediencia de los soldados nazi en la segunda guerra mundial, había llevado a cabo una investigación en la que descubrió cómo un elevado porcentaje de personas normales como nosotros “obedecían a la autoridad”. Y lo hacían incluso cuando las órdenes recibidas requerían un rompimiento severo de las normas éticas básicas. Los resultados fueron duros de digerir, sobre todo cuando los miramos desde la perspectiva de las organizaciones.

En esta ocasión quiero compartir otro experimento, de igual utilidad para el mundo del management que el del Milgram pero, esta vez, mucho más esperanzador. Se trata de los hallazgos que nos dan luz sobre uno de los vectores de trabajo de Solorelatio en los últimos años y que es central en el desarrollo de Valor Relacional: La construcción de comportamientos y condiciones que generen COOPERACIÓN en las organizaciones.

En los años 80, Robert Axelrod, licenciado en ciencias políticas y galardonado con el premio Newcomb Cleveland de la asociación

Professor of Public Policy, Gerald R. Ford School of Public Policy, University of Michigan

americana para el progreso de las Ciencias, diseñó y puso en práctica un experimento computarizado para investigar sobre las opciones de competencia-cooperación en base al famoso “Dilema del Prisionero”.  El experimento, su descripción, reflexiones y conclusiones los descubrí en su libro “La Evolución de la Cooperación” (Alianza Editorial, 1986). Uno de esos libros perdidos en una biblioteca pero que el azar y la intención te los devuelve como un regalo[1].

El dilema del prisionero

El dilema del prisionero es un problema fundamental de la teoría de juegos que muestra que dos personas pueden no cooperar incluso si ello va en contra del interés de ambas y que fue desarrollado originariamente por Merrill M. Flood y Melvin Dresher mientras trabajaban en RAND en 1950.  El dilema es un ejemplo de problema de suma no nula. Las técnicas de análisis de la teoría de juegos estándar, por ejemplo determinar el equilibrio de Nash, pueden llevar a cada jugador a escoger traicionar al otro, pero ambos jugadores obtendrían un resultado mejor si colaborasen.

En este marco Axelrod plantea su investigación en el que individuos persiguen su interés personal, sin la ayuda de una autoridad central que obligue a cada cual a cooperar con los demás….¿Les suena?

El funcionamiento del juego se presenta en la siguiente tabla.

Donde T = Recompensa por defraudar; R= Recompensa por Cooperar; P=Penalización por defraudar; I= Pago del Incauto

El dilema plantea que, sin conocer el comportamiento del otro y sin tener capacidad de influencia sobre su comportamiento, la cooperación genera una ganancia total mayor que la ganancia individual que se obtiene con defraudar (o traicionar al otro).

El Experimento

Axelrod convocó a un torneo computarizado cuyos elementos de contexto fueron:

  • Participaron 14 algoritmos diseñados por especialistas de diferentes ciencias que previamente habían realizado investigaciones sobre el dilema del prisionero y sobre la teoría de juegos en general. En concreto provenían de los ámbitos de la psicología, la economía, las ciencias políticas, las matemáticas y la sociología.
  • El objetivos planteado a todos era, aplicando la teoría de juegos, jugar con el objetivo de obtener la mayor puntuación individual posible.
  • Compitieron los 14 algoritmos más uno, denominado AZAR y que respondía de manera aleatoria a las respuestas de los otros, en un sistema de liga enfrentándose dos a dos en 200 partidas consecutivas.
  • Para buscar puntuaciones más estables entre cada par de algoritmos se jugó 5 veces el campeonato. En total se evaluaron:
    • 120,000 jugadas
    • 240,000 decisiones

La estrategia ganadora

Las estrategias presentadas se podían clasificar en cuatro grupos generales:

  • Decentes: Se le llamó así a todas las estrategias que en la primera ronda escogieron cooperar. Por ejemplo la que se denominó “Toma y Daca “ (Tit for tat) que consistía en cooperar siempre primero y luego hacer, de manera consistente, lo que hacía el oponente en la jugada anterior; o la estrategia que se denominó “Joss” que primero cooperaba pero luego intentaba apropiarse puntos defraudando de manera programada en función de comportamiento del oponente.
  • Indulgentes: Contrario a las vengativas, eran indulgentes las estrategias que, aunque habían sido defraudadas por el adversario, cooperaron en rondas futuras. Como la estrategia “Tanteadora” que cooperaba pero luego se intentaba quedar con algún punto defraudando de vez en cuando.
  • Vengativas: Se les llamó así a todas las estrategias que después de la primera defección de su adversario, no volvieron a cooperar en las rondas restantes.
  • Explotadoras: Se les llama así a las estrategias que, siempre que se encontraban ante una indulgente (y la hubieran descubierto por los patrones pasados) tendían a explotar la indulgencia, no cooperando cuando el competidor cooperaba.  Como “Tranquilizadora” que esperaba a defraudar unas 12 jugadas y, si el otro jugador no defraudaba, empezaba a defraudar de manera más frecuente.

Durante el proceso se realizó un análisis ecológico, el cual consistió en eliminar a las estrategias con puntajes inferiores al promedio después de cada ronda, e iniciar otra ronda nuevamente con las estrategias mejor puntuadas. Las estrategias con menores puntajes y que fueron eliminadas en la primera ronda fueron las vengativas y las explotadoras.

La estrategia que de manera consistente consiguió la mayor puntuación en el torneo, aunque no ganar todas las partidas jugadas fue TOMA Y DACA. Esta estrategia vencedora propuesta por Anatol Rapoport, plantea la ley del talión: ojo por ojo y diente por diente. Axelrod la definió como una estrategia colaboradora, dispuesta siempre a pactar, pero justiciera. Si la otra parte le traicionaba una vez, devolvía exactamente la misma medida, otra traición, pero sólo una vez. Era por tanto capaz de perdonar. Generaba confianza, no era rencorosa y obtenía buenos resultados (o no peores) cualquiera que fuese su oponente.

En resumen esta estrategia se caracteriza por:

  • Ser simple, clara y consistente.
  • Ser decente: empieza siempre cooperando.
  • Ser indulgente: es propensa a cooperar después de ser traicionada.
  • No reverberar: no es provocadora de espirales ni de escaladas cuando es traicionada
  • No explotar a otras estrategias.
  • Nunca sacar mejor puntuación a nivel individual, pero hacer que los dos jugadores saquen mejor puntuación que otros jugadores en sus partidas.
  • Tener capacidad de influir en contextos “competitivos y defraudadores” si actúa “haciendo piña” con otras estrategias cooperativas.

Sin duda una poderosa lista de características que nos sirve de referente para comparar nuestros comportamientos y las de nuestros equipos.

Las conclusiones

Axelrod, tras el análisis de su investigación, nos hace recomendaciones que hablan por sí solas. Leámoslas con atención. Son joyas todas ellas.

A nivel Individual nos propone lo siguiente para ser constructores de condiciones para la cooperación:

  • No ser envidiosos fruto de la comparación ya que las relaciones sociales no son un espacio de suma cero. Todos ganamos algo. Dicho de otra manera centrémonos en nuestros objetivos, en nuestras capacidades y pongamos el foco en mejorar. No es necesario tener mejores resultados que otros sino tener nuestro mejor resultado posible. La envidia, a largo plazo puede ser autodestructiva.
  • No ser el primero en no cooperar. O dicho de otro modo asumamos la base de la confianza en las relaciones humanas que es la exposición de nuestra vulnerabilidad inicial ante el otro desconociendo si ese otro nos penalizará o no. La sabiduría popular ha hecho famosa esta recomendación con la sentencia: “Otorguemos, de entrada, el voto de la confianza”.
  • Actuar con reciprocidad extrema: Ser decentes y dignos ante cualquier circunstancia. Esto significa que, una vez otorgado el voto de la confianza”, si el otro coopera nosotros cooperamos. Pero si el otro nos defrauda nosotros también lo haremos. En definitiva, que en todas las relaciones regulemos los cumplimientos con el reconocimiento positivo y los incumplimientos con la exigencia de rectificación a toda costa para que, en todo momento, queden muy claros los límites de lo que permitimos y lo que no permitimos.
  • No ser demasiado listos. Las estrategias demasiado complejas son impredecibles e incomprensibles para los demás jugadores por lo que el otro jugador podrá preferir defraudar la cooperación al no hallar patrones claros y frecuentes. Mostrémonos con claridad y vayamos al grano. La complicación y la complejidad son anti-cooperativas.

 De la misma manera que lo hace a nivel individual, Axelrod, establece un conjunto de recomendaciones para fortalecer la cooperación en contextos organizativos, partiendo de la prometedora premisa de que en ellas, las culturas de acción podeos considerarlas como no determinadas ni fijas y que, por el contrario, podemos influir en ellas y transformarlas.

Para generar condiciones para las conductas cooperativas propone:

  • Promover la interacción continua, frecuente y duradera entre personas y equipos de trabajo haciendo visibles y trabajando la calidad de sus relaciones de INTERDEPENDECIA.
  • Aumentar la importancia del impacto del futuro en las acciones presentes. De esta manera se logra minimizar el premio por la obtención del beneficio a corto plazo y teniendo claridad sobre las perspectivas del impacto del presente en las relaciones de futuro se incentiva la cooperación entre las partes. Como dice el CEO de Lego Jorgen Vig Knudstorp: “no nos avergoncemos de cometer errores, avergoncémonos de no cooperar”.
  • Construir culturas basadas en valores y competencias que promuevan la cooperación y generar conciencia en la gente para que se preocupen por los otros. Promover normas de reciprocidad como el “haz a los demás lo que quieran que hagan contigo”, y minimizar las estrategias vengativas de nunca perdonar o castigar más de lo necesario.
  • Mejorar la capacidad de reconocimiento de todos los actores de la organización. Promover la visibilidad de las mutuas interdependencias y poniendo en valor la aportación de cada parte al todo y a la configuración de un todo como el resultado de las partes. En definitiva aumentar la capacidad de actuar de manera consiente de cada actor para aumentar la efectividad de otro actor y hacerlo de manera recíproca.

Recuperar las conclusiones de Axelrod son un alivio y un acelerador. Un alivio porque tenemos más fuerza argumentativa sobre cooperación más allá de “palabras bonitas e inspiradoras”. Y un acelerador, porque  nos impulsan a crear condiciones y a hacer posible contextos en los que emerja la cooperación y ganemos espacios de trabajo en donde fluyan el reconocimiento, la reciprocidad, la agilidad, la efectividad…y las ganas de pertenecer.

A por ello….#Seguimos

 

____

[1] El contenido de este post se basa en apuntes tomados directamente del propio libro de Axelrod, de información extraída de Wikipedia y del resumen realizado realizado por Solorelatio del libro “Six Simple Rules” de Yves Morieux.

Autor Claudio Drapkin

Deja una respuesta