La teoría de juegos es el estudio de enfoques cooperativos y no cooperativos de juegos y situaciones sociales en las que los participantes deben elegir entre beneficios individuales y beneficios colectivos. Los juegos o situaciones hipotéticas involucran escenarios donde los participantes deben tomar decisiones que afectan no solo a los participantes individuales sino también a todos los demás participantes. En consecuencia, la teoría de juegos también se denomina teoría de situaciones sociales en algunos campos. Dos de las preguntas centrales de la teoría de juegos son: qué juegos tienen una mejor estrategia y cómo los participantes identifican la mejor o la más racional estrategia.
El campo se denomina “teoría de juegos” porque su enfoque a menudo se limita a situaciones hipotéticas o modelos y juegos en los que la interacción entre los participantes se puede analizar fácilmente y se pueden determinar las razones generales de las decisiones de los participantes. La teoría de juegos proporciona la información y el análisis más satisfactorios y concluyentes en juegos o escenarios más simples, aquellos con menos tomadores de decisiones y menos opciones. Debido a las complejidades inherentes de los juegos más complicados con más de dos tomadores de decisiones, la teoría de juegos se vuelve más especulativa cuando se aplica a tales juegos. En estos escenarios, los tomadores de decisiones enfrentan fuerzas que no pueden controlar, lo que dificulta monitorear y describir el comportamiento racional.
Si bien la teoría de juegos se ha aplicado a los participantes en juegos de salón y escenarios de teoría de juegos, también se ha aplicado a una variedad de situaciones de la vida real, al comportamiento humano e institucional general, lo que ha llevado a las ciencias sociales a trabajar con modelos teóricos de juegos. Numerosos campos, incluidos la biología, la informática, la economía, la política, la psicología, las matemáticas, la filosofía y la sociología, utilizan modelos de teoría de juegos.
Si bien la teoría de juegos tiene antecedentes que se remontan a la antigüedad y al siglo XVIII, surgió como una disciplina científica a principios del siglo XX, resultado de los esfuerzos por aplicar el análisis cuantitativo a los dilemas cognitivos abstractos. Debido a las metodologías poco desarrolladas y la falta de una aplicación coherente demostrable para propósitos más ampliamente útiles, fue ignorada en gran medida hasta la década de 1940.
Durante los primeros años de la Guerra Fría, sin embargo, se lograron avances significativos que la legitimaron como una ciencia con pruebas comprobables. Como resultado, ciertos aspectos de la teoría de juegos podrían aplicarse a los juegos de guerra y la estrategia militar global, las estrategias económicas y de precios, los problemas sociales e incluso la negociación laboral.
La teoría de juegos ha creado con frecuencia uniones difíciles de supuestos matemáticos y de comportamiento que produjeron cálculos tan ridículamente mecánicos como “megadeaths” en la estrategia militar, donde ciertos escenarios de guerra nuclear podrían extrapolarse en pronósticos de cuántos millones de personas morirían. En otras áreas, sin embargo, las capacidades de la teoría de juegos se limitaron a simples programas de marketing para productos como cigarrillos, automóviles y pasta de dientes. Aquí, las aplicaciones de la teoría de juegos podrían probarse para verificar su validez mientras que ciertas deficiencias podrían identificarse fácilmente y hacerse ajustes.
La teoría de juegos también puede considerarse una técnica de modelado que se utiliza para anticipar y explicar las acciones de todos los agentes involucrados en situaciones competitivas y para probar y determinar la optimización relativa de diferentes estrategias. Sus aplicaciones principales son la programación lineal, la toma de decisiones estadísticas , la investigación de operaciones y la planificación militar y económica. Las extensiones recientes de la teoría de juegos incluyen el uso de modelos de teoría de juegos para resolver dilemas sociales y éticos, así como para elegir cuándo implementar estrategias cooperativas y competitivas en los negocios.
EL DESARROLLO DE LA TEORÍA DEL JUEGO
Aunque al matemático estadounidense John von Neumann (1903-1957) generalmente se le atribuye el mérito de haber fundado la disciplina moderna de la teoría de juegos, otros pensadores del siglo XX ayudaron a preparar el escenario para von Neumann y los teóricos posteriores. Los primeros trabajos de la teoría de juegos, incluido el de von Neumann, se centraron en juegos en los que el ganador se lo lleva todo (suma cero) con competencia pura, como el ajedrez y las damas. Por ejemplo, uno de los primeros trabajos de teoría de juegos del siglo fue un teorema desarrollado para juegos de suma cero propuesto en 1913 por Ernst Zermelo, quien argumentó que los juegos como el ajedrez están estrictamente determinados porque toda la información en el juego se revela de inmediato y porque las reglas prescritas gobiernan las acciones de todos los jugadores. Sin embargo, la solución al ajedrez es tan compleja que nadie puede determinarla. Los jugadores ganan una partida de ajedrez no ejecutando una solución, sino ejecutando una estrategia imperfecta y capitalizando los errores del oponente. Por el contrario, las personas pueden determinar la solución al tic-tac-toe y obtener fácilmente puntos muertos.
Harold Kuhn amplió el teorema de Zermelo argumentando que las estrategias en las jugadas de un juego estarán en equilibrio si las decisiones tomadas por los jugadores son racionales. Estos equilibrios pueden extenderse a combinaciones de juegos, e incluso al juego en su conjunto, eliminando la limitación de que los juegos sean de suma cero e individualmente racionales. Otra extensión de la teoría fue hecha por Rufus Isaacs, quien estableció el concepto del juego diferencial, donde la información perfecta puede no existir.
En 1928 von Neumann publicó su artículo fundamental, “Teoría de los juegos de salón”, en el que hablaba de los faroles en el póquer, abordó las aplicaciones económicas y militares de la teoría de los juegos y desarrolló la estrategia “minimax” en la que los tomadores de decisiones intentan minimizar la cantidad máxima de las pérdidas que otros tomadores de decisiones pueden infligir.
El economista estadounidense Oskar Morgenstern (1902-1977) reconoció la naturaleza interactiva de las actividades económicas: que las decisiones de cada persona dependen de las decisiones de todas las demás. En su innovador libro, The Theory of Games and Economic Behavior, publicado en 1944, Morgenstern y von Neumann desarrollaron aplicaciones de la teoría de juegos a los problemas planteados por la interactividad.
Además, von Neumann y Morgenstern proporcionaron una base para nuevos conceptos en la teoría de juegos, incluida la idea de juegos cooperativos y no cooperativos. Un juego cooperativo es aquel en el que grupos de jugadores están obligados por acuerdos a trabajar en interés mutuo, más que individual, incluso cuando el juego no cooperativo sería más beneficioso.
En la década de 1950, John Nash y otros ampliaron el estudio de la teoría de juegos no cooperativos y crearon el marco para la teoría de juegos cooperativos. La identificación de Nash del equilibrio en los modelos de teoría de juegos contribuyó significativamente a la teoría de juegos moderna. Nash abordó las estrategias no cooperativas, particularmente en los juegos cooperativos donde la subversión es una consideración estratégica. En 1951 proporcionó aplicaciones del teorema de interdependencia de von Neumann-Morgenstern, anteriormente utilizado principalmente en la estrategia militar, a problemas económicos.
En el enfoque de Nash es fundamental el concepto de racionalidad individual, donde cada jugador puede determinar cuándo es mejor derogar un acuerdo. Nash dijo que se establece un equilibrio en cualquier juego no cooperativo donde los acuerdos son autoaplicables, donde los beneficios de engañar a un socio son superados por la retribución futura. El equilibrio de Nash se observa en juegos en los que los jugadores adoptan estrategias mixtas o siguen un curso de juego con dos o más metas diferentes, pero relacionadas.
Se puede decir que los equilibrios de Nash hacen que los juegos no cooperativos sean cooperativos y, por lo tanto, los juegos que lo presentan son algo predecibles. Pero ilustran otra faceta de la teoría de juegos, la de la eficiencia de Pareto, llamada así por el economista italiano Vilfredo Pareto (1848-1923). Los jugadores cooperativos negociarán una alianza que sea individualmente óptima para el Pareto; su recompensa será menor, pero sus posibilidades de ganar algo son mejores.
LOS PRINCIPIOS DE LA TEORÍA DEL JUEGO
La mayoría de los modelos de teoría de juegos involucran las siguientes cinco condiciones:
- Cada tomador de decisiones tiene dos o más opciones o secuencias de opciones (“jugadas”).
- Todas las combinaciones posibles de decisiones o jugadas dan como resultado un resultado claro: ganar o perder.
- Los escenarios tienen un resultado bien definido y los tomadores de decisiones reciben una “recompensa (el valor del resultado para los participantes). Es decir, los participantes ganarán o perderán algo según el resultado”.
- Los que toman las decisiones conocen las reglas del juego, así como los beneficios de los otros tomadores de decisiones.
- Los que toman las decisiones son racionales: cuando se enfrentan a dos alternativas, los jugadores elegirán la opción que les brinde los mayores beneficios.
Si bien los que toman las decisiones conocen las reglas y las opciones de sus oponentes, no conocen de antemano las decisiones reales de sus oponentes. Por lo tanto, quienes toman las decisiones deben elegir opciones basadas en suposiciones de lo que elegirán sus oponentes. Algunos escenarios de teoría de juegos también son juegos de suma cero, lo que significa que un tomador de decisiones gana lo que otro pierde. Otros, sin embargo, permiten ganancias y pérdidas mutuas. Además, estos escenarios o juegos involucran varias estrategias: minimizar las pérdidas máximas que otro tomador de decisiones puede causar y tomar decisiones basadas en la probabilidad.
Además, los juegos y escenarios admiten diferentes grados de información. Los juegos de información perfecta como el ajedrez y las damas no contienen sorpresas: cada jugador tiene un número finito de movimientos y cada jugador ve los movimientos del oponente y puede responder a ellos inmediatamente. Pero otros juegos y escenarios, como el dilema del prisionero (que se analiza a continuación), contienen sorpresas y más conjeturas.
John Harsanyi postuló que en juegos diferenciales o asimétricos (incluso ajedrez, damas, etc.), cada jugador está seguro solo sobre su propia función de utilidad, pero debe especular sobre las funciones de utilidad de otros jugadores y, lo que es más importante, la concepción de otros jugadores de las funciones de utilidad de todos los demás jugadores. En pocas palabras, cada jugador debe conocer su propia probabilidad de pago, adivinar las probabilidades de pago de otros jugadores y también adivinar lo que otros jugadores están adivinando sobre su propia probabilidad de pago. Además, el jugador debe adivinar lo que otros jugadores están adivinando sobre sus conjeturas sobre ellos, formando una regresión infinita.
JUEGOS Y ESTRATEGIAS COMPETITIVAS
A diferencia de los juegos de azar como la ruleta o el lanzamiento de monedas, los juegos y escenarios tratados por la teoría de juegos requieren que los participantes consideren lo que los otros participantes están pensando y lo que harán. En consecuencia, la probabilidad por sí sola no ayudará a los tomadores de decisiones en escenarios de teoría de juegos como lo hace en algunos juegos. La teoría de juegos explora una variedad de juegos que comienzan con juegos de suma cero para dos personas y se extienden a juegos de suma no cero con un número infinito de participantes. Los juegos de suma cero incluyen ajedrez, damas, póquer y bridge, y se caracterizan por: un jugador gana a expensas de otro, todos los jugadores que intentan ganar y su finitud (un jugador tiene solo un número finito de opciones en cada turno). ). Si ambos jugadores intentan ganar,
Una tarea central de la teoría de juegos es describir las estrategias que adoptan los jugadores para ganar. La estrategia es una forma específica de jugar un juego o el grupo de decisiones que toma un jugador en un esfuerzo por ganar el juego. Los primeros trabajos de Von Neumann identificaron la mejor estrategia para este tipo de juegos con su principio minimax. En el dilema del prisionero, William Poundstone ofreció un escenario simple para demostrar este principio. Suponga que dos niños deben dividir un trozo de pastel entre ellos y uno de los niños puede cortar el pastel, mientras que el otro elige primero. Este método de dividir el pastel evita que los niños discutan sobre quién consiguió el trozo más grande, ya que si el cortador corta el pastel de manera desigual, el seleccionador seleccionará el trozo más grande. Los niños tienen dos opciones cada uno. Si bien el cortador quiere la mayor cantidad de pastel posible, sabe que su mejor opción es cortar el pastel lo más uniformemente posible, ya que si agranda un trozo, el que elige lo seleccionará. Por lo tanto, el cortador corta el pastel lo más uniformemente posible para minimizar la cantidad máxima que puede obtener el selector, es decir, para evitar lo peor.
JUEGOS Y ESTRATEGIAS COOPERATIVAS
A diferencia de los juegos de suma cero, los juegos y escenarios cooperativos involucran a tomadores de decisiones con intereses mutuos que pueden tomar sus decisiones de manera colaborativa, o donde una estrategia cooperativa produciría los mayores beneficios para todas las partes involucradas. Estos juegos o escenarios pueden incluir dos o más participantes.
Una condición previa para la cooperación y la no cooperación es que la recompensa, o “recompensa”, tenga una utilidad transferible, es decir, que todos los jugadores valoren la recompensa por igual. Asimismo, cada jugador debe valorar por igual las amenazas asociadas con perder. Si hay diferencias en cualquier caso, las motivaciones de los jugadores diferirán en consecuencia, lo que posiblemente afectará los términos del acuerdo entre los jugadores.
Además, los juegos no cooperativos pueden involucrar estrategias tanto cooperativas como no cooperativas. En un juego de Monopoly, por ejemplo, donde hay seis jugadores, cada jugador puede comprar y mantener ciertas propiedades para negar a otros jugadores el monopolio del grupo al que pertenece esa propiedad, lo que impide que los oponentes coloquen casas y hoteles. Sin embargo, un grupo de dos jugadores puede encontrar ventajoso cooperar intercambiando propiedades que el otro quiere, lo que permite que cada uno cree mayores amenazas para otros jugadores.
A medida que avanza el juego, es probable que los otros cuatro jugadores, que se encuentran en posiciones estratégicamente más débiles, sean víctimas de esta estrategia y quebrados. En este punto, el propósito de la cooperación ha seguido su curso y los dos jugadores comienzan el juego no cooperativo de oposición.
Los juegos cooperativos siguen siendo cooperativos solo mientras las condiciones de su acuerdo sigan siendo aplicables y efectivas. Se vuelven no cooperativos cuando las posibles recompensas individuales superan la base de la cooperación.
En juegos con más de dos jugadores, los grupos de jugadores pueden formar coaliciones para obtener beneficios mutuos. Las formas parlamentarias de gobierno son un buen ejemplo de cómo funcionan las coaliciones. Cuando una elección niega a un partido la mayoría absoluta, puede formar coaliciones con otros partidos para lograr la mayoría. Estas coaliciones se basan en acuerdos para unir intereses, una situación inestable, dado que las partes de una coalición tienen conflictos apreciables. Si un socio de coalición más pequeño siente que la coalición lo ha servido mal, puede disolver su asociación y derrocar al gobierno.
Otro ejemplo de un escenario de teoría de juegos que requiere una estrategia cooperativa proviene del dilema del prisionero, que fue articulado por primera vez de esta manera por Al Tucker. Tucker usó el ejemplo de dos sospechosos que participaron en un crimen. Los fiscales tienen pruebas suficientes para demostrar que ambos son cómplices, pero no pueden probar quién era el líder. Ofrecen a cada sospechoso una propuesta: testificar contra el otro o permanecer en silencio.
Si ambos presos guardan silencio, van a la cárcel por un año. Si se implican entre sí, van a la cárcel por dos años. Pero si el prisionero A negocia e implica al prisionero B, y el prisionero B permanece en silencio, el prisionero A no tiene tiempo en la cárcel y el prisionero B recibe seis años. Lo contrario se aplica si B implica a A y A permanece en silencio. El dilema puede expresarse en una matriz (ver Figura 1).
Figura 1
El dilema que identificó Tucker es si cada preso debe confesar o permanecer en silencio. Si cada uno desea a toda costa evitar pasar seis años en la cárcel, estará motivado para confesar y no podrá pasar ningún tiempo en la cárcel o puede pasar hasta dos años en la cárcel, dependiendo de si su cómplice confiesa. Pero si uno de estos presos desea la opción de beneficio mutuo, puede arriesgarse a permanecer en silencio y esperar que su pareja también permanezca en silencio para pasar solo un año tras las rejas. La estrategia cooperativa de que ambos presos permanezcan en silencio resultaría en que cada preso pasara solo un año en la cárcel. Sin embargo, cada prisionero no puede estar seguro de que el otro también permanecerá en silencio. Por eso,
Los dilemas cooperativos a los que se enfrentan los jugadores en este escenario se vuelven más complejos cuando no se limitan a juegos únicos “one-shot”, sino que se extienden a rondas adicionales. Estos juegos dinámicos, incluidos los juegos repetidos, proporcionan a los jugadores una base de conocimiento, es decir, el comportamiento de otros jugadores, que pueden emplearse en situaciones futuras. Este conocimiento se define en el Teorema popular, que establece que el incumplimiento de los acuerdos de cooperación puede resolverse en escenarios posteriores y los engañadores serán castigados la próxima vez. El teorema de Nash sugiere que los jugadores con aversión al riesgo serán recompensados con más frecuencia por cooperar que por no cooperar.
Aunque el dilema del prisionero puede parecer rudimentario, se puede adaptar fácilmente a escenarios complejos de toma de decisiones. Considere que cinco compañías aéreas compiten en un mercado de tres ciudades. Por tanto, la matriz se expande a tres conjuntos, o dimensiones, de matrices de cinco por cinco, lo que arroja 75 resultados posibles. Agregue la dimensión del tiempo y el número de decisiones se multiplica en cada período en cuestión.
Al tratar con los resultados indicados por matrices, un jugador puede buscar maximizar las oportunidades para terminar por delante de sus oponentes mediante la adopción de una estrategia en la que la suma de sus pagos mínimos es mayor que la suma de la suma de los pagos mínimos de sus oponentes. Esto se denomina criterio minimax y asegura que los resultados de este jugador superarán o dominarán a los de sus oponentes.
APLICACIONES EMPRESARIALES Y
ECONOMICAS
Si bien los modelos de teoría de juegos se han aplicado a numerosas disciplinas, originalmente se desarrollaron para explicar fenómenos económicos. Por lo tanto, gran parte de la discusión anterior tiene relevancia directa para los negocios y la economía. Según Adam M. Brandenburger y Barry J. Nalebuff, autores de Coopetition, el uso principal de la teoría de juegos para los negocios es ayudar a los tomadores de decisiones de la empresa a determinar cuándo cooperar y cuándo competir. Descubrieron que la cooperación generalmente es útil para expandir un mercado y la competencia para dividir un mercado.
En su aplicación de la teoría de juegos a los negocios, Brandenburger y Nalebuff también señalan que cada participante en cualquier juego o escenario dado tiene una cierta cantidad de poder, o “valor agregado”, que es igual a la recompensa menos la cantidad que sería la recompensa si un participante específico no estuvo involucrado. El valor agregado representa, por ejemplo, el poder de negociación de una empresa y sus distribuidores. El productor de videojuegos Nintendo tiene mucho más poder que las tiendas que venden sus cartuchos de juegos, porque la compañía mantiene solo una pequeña cantidad de juegos. Como resultado, es posible que no tenga suficiente para enviar a todos los minoristas en un momento dado. Por lo tanto, las tiendas han estado dispuestas a vender juegos de Nintendo con pequeños márgenes de ganancia solo para poder ofrecerlos.
Además, los modelos no cooperativos se pueden utilizar para explicar las decisiones y acciones de la empresa. Por ejemplo, varias empresas han enfocado y continúan enfocando los negocios como una situación de ganar o perder y, por lo tanto, basan sus decisiones de marketing en un modelo de suma cero de dos jugadores no cooperativo. Por ejemplo, la competencia entre empresas como Coca-Cola y Pepsi, Ford y General Motors, McDonald’s y Burger King ha tomado la forma de este tipo de modelo no cooperativo. Algunas empresas que adoptaron esta estrategia han tenido éxito. General Motors, por ejemplo, lo utilizó para ganar su importante participación en el mercado de la industria del automóvil. En la década de 1920, General Motors lanzó un ataque contra Ford al ingresar al mercado de autos de bajo precio y luego dominado por Ford y ofrecer autos con más funciones a un precio ligeramente más alto. La estrategia funcionó e invirtió los roles de los fabricantes de automóviles: General Motors llegó a controlar alrededor del 50 por ciento del mercado de automóviles, mientras que Ford anteriormente había controlado esa participación de mercado. Por lo tanto, General Motors ganó en efecto la recompensa a expensas de Ford.
Sin embargo, el modelo de suma cero se aplica principalmente a los estados de competencia perfecta y a los duopolios, y muchos mercados no se parecen a los modelos simples de suma cero para dos jugadores. Como se discutió anteriormente, los jugadores en estos contextos de múltiples participantes más complejos intentan obtener el mejor resultado posible, no vencer a todos los demás jugadores. Por ejemplo, las alianzas en la industria informática se han traducido en beneficios mutuos. Microsoft e Intel, por ejemplo, se han beneficiado de cooperar y no intentar ganar o robarse el mercado de cada uno. Microsoft se beneficia cuando Intel produce procesadores más rápidos e Intel se beneficia cuando Microsoft produce software avanzado que hace uso de sus procesadores más rápidos. Por el contrario, las empresas informáticas compatibles con Apple e IBM competían, y las empresas compatibles con IBM terminaron con la recompensa a expensas de Apple. Además, mientras Coca-Cola y Pepsi luchan fervientemente por una participación en el mercado de la cola, cooperaron para presionar al fabricante de NutraSweet para que redujera su precio amenazando con que ambas compañías cambiarían a un edulcorante artificial alternativo.
El modelo de juego cooperativo es especialmente aplicable a la economía porque, si bien algunas políticas y prácticas económicas limitan la cooperación (por ejemplo, leyes y leyes antimonopolio), las actividades económicas dependen de la cooperación por su naturaleza. Por ejemplo, muchos aspectos de la economía no son competitivos: policía, escuelas, bibliotecas, transporte público y servicios públicos (aunque se están volviendo más competitivos). Además, la Junta de la Reserva Federal controla la moneda del país. Además, la relación entre el comprador y el vendedor también es de cooperación en su mayor parte. Ambos participan de forma consensuada en una transacción y se benefician de ella.