¿Qué es la teoría de juegos? ¿Rebelde? ¡Ha llegado el maestro! !
¿Qué es la teoría de juegos?
La teoría de juegos, a veces llamada teoría de juegos, es una teoría y un método para estudiar el fenómeno de la lucha o la competencia. No es sólo una nueva rama de las matemáticas modernas, sino también un tema importante en la investigación de operaciones.
2. El juego del dilema del prisionero
Dos ladrones que cometieron un delito juntos fueron llevados a la comisaría y puestos en régimen de aislamiento. Si una de las partes coopera con la policía y confiesa lo que hizo con la otra parte, pero la otra parte no confiesa, la parte confesada será liberada y la otra parte será sentenciada a tres años de prisión. Si ambas partes confiesan, cada una será condenada a 1 año de prisión; si ninguna de las partes confiesa, será condenada a 1 mes de prisión por falta de pruebas policiales. ¿Cómo elegirán estos dos ladrones?
3. El desarrollo de la teoría de juegos
La idea de teoría de juegos existe desde la antigüedad, y "El arte de la guerra" no es sólo una obra militar, sino también la primera monografía sobre teoría de juegos. La teoría de juegos se centró inicialmente en el estudio de ganar y perder en ajedrez, bridge y juegos de azar. La comprensión de la situación del juego por parte de la gente sólo se basa en la experiencia y no se ha convertido en una teoría. No fue hasta principios del siglo XX que se convirtió oficialmente en una disciplina. En 1928, von Neumann demostró los principios básicos de la teoría de juegos, anunciando así el nacimiento de la teoría de juegos. En 1944, la obra maestra que hizo época "Teoría de juegos y comportamiento económico" escrita por von Neumann Morgenstern amplió la estructura de juego de dos personas a una estructura de juego de n personas y aplicó el sistema de teoría de juegos al campo económico, sentando así las bases para fundamento y sistema teórico de esta disciplina. Cuando se trata de teoría de juegos, no se pueden ignorar los artículos fundamentales del genio de la teoría de juegos Nash, "Equilibrium Points of N-Player Games" (1950), "Non-Cooperative Games" (1951), etc. , y da el concepto de equilibrio de Nash y el teorema de existencia del equilibrio. Además, la investigación de Selton y Hassani también promovió el desarrollo de la teoría de juegos. Hoy en día, la teoría de juegos se ha convertido en una disciplina relativamente completa.
4. Conceptos básicos de la teoría de juegos
1) Elementos del juego
(1) Jugadores: En un juego o juego, cada uno tiene poder de decisión. de los participantes se convierten en jugadores. Los juegos con sólo dos jugadores se denominan "juegos para dos jugadores" y los juegos con más de dos jugadores se denominan "juegos multijugador".
(2) Estrategia: En un juego, cada jugador tiene un plan de acción factible y completo, es decir, el plan no es un plan de acción para una determinada etapa, sino un plan para guiar toda la acción. Es el plan viable de cada jugador de principio a fin.
Un plan de acción planeado por esta oficina se llama estrategia de las personas en esta oficina. Si todos en un juego siempre tienen un número finito de estrategias, se llama "juego finito", en caso contrario se llama "juego infinito".
(3) Ganancias y pérdidas: El resultado al final de una ronda se llama ganancia o pérdida. Al final de un juego, las ganancias y pérdidas de cada jugador no sólo están relacionadas con la estrategia elegida por el propio jugador, sino también con el conjunto de políticas adoptadas por el jugador en toda la situación. Por lo tanto, la "ganancia o pérdida" de cada jugador al final de un juego es una función de un conjunto de políticas establecidas por todos los jugadores, a menudo denominada función de pago.
(4) Para los participantes del juego, hay un resultado del juego.
(5) El juego implica equilibrio: el equilibrio es el equilibrio. En economía, el equilibrio es cuando la cantidad relevante tiene un valor estable. En la relación entre oferta y demanda, si el mercado de un bien tiene un precio determinado, cualquiera que quiera comprar el bien a ese precio puede comprarlo y cualquiera que quiera venderlo puede venderlo. En este momento decimos que la oferta y la demanda de este producto básico han alcanzado el equilibrio. El llamado equilibrio de Nash es un resultado de juego estable.
Equilibrio de Nash: En una combinación de estrategias, todos los participantes se enfrentan a una situación en la que su estrategia es óptima si los demás no cambian sus estrategias. En otras palabras, si cambia su estrategia en este momento, su pago disminuirá. En un equilibrio de Nash, ningún jugador racional siente la necesidad de cambiar de estrategia individualmente. La premisa para demostrar la existencia del punto de equilibrio de Nash es el concepto de "par de equilibrio del juego". La llamada "pareja de equilibrio" significa que en un juego de suma cero entre dos personas, el jugador A adopta su estrategia óptima a* y el jugador B también adopta su estrategia óptima b*. Si el jugador A todavía juega b*, pero el jugador A adopta otra estrategia A, entonces el pago del jugador A no excederá el pago de su estrategia original a*. Este resultado también es válido para el jugador b.
De esta forma, el "par equilibrado" queda claramente definido como: un par de estrategias a* (perteneciente al conjunto de estrategias A) y b* (perteneciente al conjunto de estrategias B) se denomina par equilibrado. Para cualquier estrategia A (perteneciente al conjunto de estrategias A) y estrategia B (perteneciente al conjunto de estrategias B), siempre hay un par par (A, b*) ≤ par par (a*, b*) ≤.
Los juegos de suma distinta de cero también tienen la siguiente definición: un par de estrategias a* (perteneciente al conjunto de estrategias A) y b* (perteneciente al conjunto de estrategias B) se denomina par de equilibrio de un -Juego de suma cero. Para cualquier estrategia A (perteneciente al conjunto de estrategias A) y estrategia B (perteneciente al conjunto de estrategias B), siempre existe: par par (A, b*) ≤ par par (a*, b*) jugador A; a*) , b) ≤ la pareja del jugador B (a*, b*) en el juego.
Con la definición anterior se obtiene inmediatamente el teorema de Nash:
Cualquier juego de dos jugadores de estrategia pura finita tiene al menos un par de equilibrio. Este par de equilibrio se llama punto de equilibrio de Nash.
La demostración estricta del teorema de Nash requiere la teoría del punto fijo, que es la principal herramienta para estudiar el equilibrio económico.
En términos generales, encontrar la existencia de un punto de equilibrio equivale a encontrar el punto fijo del juego.
El concepto de punto de equilibrio de Nash proporciona un método analítico muy importante, que permite a la investigación de la teoría de juegos encontrar resultados más significativos en una estructura de juego.
Pero la definición de punto de equilibrio de Nash se limita a cualquier jugador que no quiera cambiar unilateralmente su estrategia, ignorando la posibilidad de que otros jugadores cambien sus estrategias. Por lo tanto, la conclusión del punto de equilibrio de Nash a menudo no es convincente. Los investigadores lo llaman vívidamente "punto de equilibrio de Nash inocente y lindo".
R Selten eliminó algunos puntos de equilibrio irrazonables en equilibrios múltiples de acuerdo con ciertas reglas, formando así dos conceptos de equilibrio refinados: equilibrio completo en subjuegos y equilibrio perfecto con mano temblorosa.
2) Tipos de juegos
(1) Juego cooperativo: estudia cómo las personas distribuyen los beneficios de la cooperación cuando llegan a la cooperación, es decir, el problema de la distribución del ingreso.
(2) Juego no cooperativo: estudia cómo las personas toman decisiones para maximizar sus propios intereses cuando los intereses se influyen entre sí, es decir, la selección estratégica.
(3) Juegos con información completa e información incompleta: los jugadores tienen una comprensión completa del espacio de estrategia y los pagos bajo combinaciones de estrategias de todos los participantes, lo que se denomina información completa; la información está incompleta.
(4) Juego estático y juego dinámico
Juego estático: se refiere a una situación en la que los participantes realizan acciones al mismo tiempo, o aunque existe una secuencia, este último actor no lo hace. conocer la información del actor anterior.
Juego dinámico: se refiere a la secuencia de acciones de ambas partes. Este último actor puede conocer la estrategia del actor anterior.
Distribución de la propiedad y valor de Shapley
Considere un juego cooperativo de este tipo: A, B, C y C votan para decidir cómo distribuir 654,38+0 millones de yuanes. Tienen el 50% y. 40% respectivamente, 654,38+00% de potencia. Según las normas, un plan sólo puede aprobarse si más del 50% de los votos están a favor. Entonces, ¿cómo distribuirlo de manera razonable? Según la distribución de votos, C propuso a A: 500.000, B400.000, C65438+100.000: 700.000, b0, C300.000; B propuso a A: 800.000, B200.000, c0...
Índice de poder: El poder de cada tomador de decisiones en la toma de decisiones se refleja en el número de "participantes clave" en su alianza ganadora. El número de "participantes clave" se denomina índice de poder.
Valor de Shapley: bajo varios órdenes de alianza posibles, la suma de las contribuciones marginales de los participantes a la alianza se divide entre varias combinaciones de alianzas posibles.
Orden abc acb bac bca cab cba
Principales participantes
Los valores de Shapley de A, B y C se calculan como 4/6, 1 /6 respectivamente, 1/6.
Entonces A, B y C deberían obtener 2/3, 1/3 y 1/3 de 1/3 respectivamente.
5. La importancia de la teoría de juegos
El método de investigación de la teoría de juegos, como muchas otras disciplinas que utilizan herramientas matemáticas para estudiar fenómenos sociales y económicos, consiste en abstraer elementos básicos de complejos. Analizar el modelo matemático formado por estos elementos, para luego introducir gradualmente otros factores que inciden en su situación y producción para analizar sus resultados.
A partir de diferentes niveles de abstracción, se forman tres expresiones de juego, que pueden utilizarse para estudiar diversos problemas. Por eso se le llama "matemáticas para las ciencias sociales". En teoría, la teoría de juegos es una teoría formal que estudia la interacción entre actores racionales, pero en realidad está penetrando en la economía, las ciencias políticas, la sociología, etc., y es aplicada por diversas ciencias sociales.
1. La teoría de juegos significa que los individuos u organizaciones, frente a ciertas condiciones ambientales y bajo ciertas reglas, se basan en la información que tienen para elegir e implementar sus propios comportamientos o estrategias, y obtener los resultados correspondientes. o beneficio del proceso. La teoría de juegos es un concepto teórico muy importante en economía.
¿Qué es la teoría de juegos? Como dice el viejo refrán, las cosas son como el ajedrez. Todos en la vida son como un jugador de ajedrez y cada movimiento es como colocar una moneda en un tablero de ajedrez invisible. Los jugadores de ajedrez inteligentes y prudentes se reconocieron y se controlaron. Todos se esforzaron por ganar y jugaron muchas partidas de ajedrez emocionantes y variadas. La teoría de juegos consiste en estudiar la parte racional y lógica del "juego de ajedrez" de los ajedrecistas y sistematizarla en una ciencia. En otras palabras, se trata de estudiar cómo los individuos obtienen las estrategias más razonables en interacciones complejas. De hecho, la teoría de juegos proviene de juegos antiguos o de ajedrez y de cartas. Los matemáticos abstraen problemas específicos y estudian sus leyes y cambios estableciendo un marco y un sistema lógico completo. Esta no es una tarea fácil. Tomemos como ejemplo el juego más sencillo para dos jugadores. Si lo piensas, sabrás que hay un gran misterio. Si se supone que ambas partes recuerdan con precisión cada movimiento realizado por ellos y sus oponentes, y que ambos son los jugadores más "racionales", entonces, cuando A está jugando, para ganar el juego, debe considerar cuidadosamente los pensamientos de B, y B está jugando. También tiene que considerar la idea de A, entonces A tiene que pensar que B está considerando su idea. Por supuesto, B sabe que A ya la ha considerado.
Frente a tal niebla, ¿cómo puede la teoría de juegos comenzar a analizar y resolver problemas, y cómo encontrar soluciones óptimas para resumir los problemas matemáticos abstractos como realidad, brindando así la posibilidad de guiar la práctica en teoría? La teoría de juegos moderna fue fundada por el matemático húngaro von Neumann en la década de 1920. Su obra maestra "Teoría de juegos y comportamiento económico", publicada en 1944 en colaboración con el economista Oscar Morgenstern, marcó el comienzo de la formación inicial de la teoría de juegos de sistemas moderna. Para juegos no cooperativos y puramente competitivos, Neumann solo resuelve juegos de suma cero entre dos personas, como si dos personas jugaran al ajedrez o al tenis de mesa. Una persona gana un juego y la otra pierde el otro. El beneficio neto es cero. El problema abstracto del juego aquí es si encontrar y cómo encontrar una "solución" o "equilibrio" teórico dado el conjunto de jugadores (ambos lados), el conjunto de estrategias (todos los movimientos) y el conjunto de ganancias (ganadores y perdedores). , es decir, la estrategia específica más “razonable” y óptima para ambos participantes. ¿Qué es "razonable"? Aplicando el criterio de "mínimo-máximo" en el determinismo tradicional, es decir, cada parte en el juego asume que el propósito fundamental de todas las ventajas y desventajas de la otra parte es maximizar sus propias pérdidas y optimizar sus propias estrategias en consecuencia. Empezando por las matemáticas Lo anterior demuestra que a través de ciertas operaciones lineales, cada juego de suma cero de dos personas puede encontrar una "solución mínimo-máximo". A través de ciertas operaciones lineales, dos competidores utilizan aleatoriamente cada paso en un conjunto de estrategias óptimas en forma de distribución de probabilidad, logrando así, en última instancia, ganancias máximas e iguales entre sí. Por supuesto, la implicación es que esta estrategia óptima no depende de las operaciones del oponente en el juego. En términos sencillos, la idea "racional" básica incorporada en este famoso teorema del maximino es "esperar lo mejor y prepararse para lo peor".
2. En economía, las "ganancias del cerdo" son un ejemplo famoso de teoría de juegos.
Este ejemplo trata sobre: Hay dos cerdos en la pocilga, un cerdo grande y un cerdo pequeño. Hay un pedal a un lado de la pocilga. Cada vez que se pisa el pedal, una pequeña cantidad de comida caerá en el puerto de alimentación al otro lado de la pocilga, lejos del pedal. Si un cerdo pisa el pedal, el otro cerdo tiene la oportunidad de comerse primero la comida que cae del otro lado. Tan pronto como el cerdo pisa el pedal, el cerdo grande terminará toda la comida justo antes de que el cerdo corra hacia el comedero, si el cerdo grande pisa el pedal, antes de que el cerdito termine de comer la comida caída, todavía queda un; oportunidad de correr hacia el comedero y competir por la comida restante.
Entonces, ¿qué estrategia adoptarán los dos cerdos? La respuesta es: el cerdito elegirá la estrategia del "autostop", es decir, esperar cómodamente durante el periodo bajo, el cerdito correrá incansablemente de un lado a otro entre el pedal y el comedero, sólo para coger un poco de sobra.
¿A qué se debe esto? Porque el cerdito no puede conseguir nada pedaleando, pero puede comer sin pedalear. Para el cerdito, tanto si el cerdo grande pisa el pedal como si no, no pisarlo siempre es una buena opción. Por otro lado, Big Pig sabe que Little Pig no pisará el acelerador. Es mejor pisar el acelerador que no, así que tiene que hacerlo él mismo.
El fenómeno del "cerdito acostado y el cerdo grande corriendo" es causado por las reglas del juego en la historia. Los indicadores centrales de las reglas son: la cantidad de cosas que caen cada vez y la distancia desde el pedal hasta el puerto de alimentación.
Si se cambian los indicadores básicos, ¿aparecerá en el chiquero el mismo escenario de "los cerdos se acuestan y los cerdos grandes corren"? Probar.
Cambio 1: Restaurar plan. Alimente sólo la mitad del peso corporal original. Como resultado, el cerdito y el cerdito grande dejaron de pedalear. Si el cerdito lo pisa, el cerdito grande se terminará la comida; si el cerdito grande lo pisa, el cerdito se terminará la comida. Quien pedalea significa aportar comida a la otra parte, así nadie tendrá la motivación para pedalear.
Si el objetivo es hacer que el cerdo patee más, el diseño de esta regla del juego es evidentemente un fracaso.
Cambio de plan dos: plan incremental. Alimente el doble que antes. Como resultado, tanto el cerdito como el cerdito grande pueden patear. Cualquiera que quiera comer puede patearlo. De todos modos, la otra persona no comerá toda la comida de una vez. Los cerditos y los cerdos grandes equivalen a vivir en una sociedad "materialista" con materiales relativamente abundantes y su sentido de competencia no es muy fuerte.
Para los diseñadores de reglas de juegos, el costo de esta regla es bastante alto (proporcionar dos porciones de comida a la vez y, como la competencia no es fuerte, hacer que los cerdos pateen más no tiene ningún efecto);
Plan de cambio tres: plan de reducción y turno. Alimente solo la mitad del peso original, pero al mismo tiempo mueva el puerto de alimentación cerca del pedal. Como resultado, tanto el cerdito como el cerdito grande patearon con fuerza. Los que esperan no comerán y los que trabajan duro obtendrán más. Cada cosecha es sólo una flor.
Para los diseñadores de juegos, esta es la mejor solución. El costo no es alto, pero la ganancia es máxima.
La historia original de "Wisdom Pig Game" inspiró al débil (cerdo) de la competencia a esperar la mejor estrategia. Pero para la sociedad, la asignación de recursos sociales cuando Piggy hace autostop no es óptima porque Piggy no participó en la competencia. Para lograr la asignación más eficiente de recursos, los diseñadores de las reglas no quieren que nadie se beneficie, y lo mismo ocurre con los gobiernos, y lo mismo ocurre con los jefes de las empresas. Que el fenómeno del "gorrón" pueda eliminarse por completo depende de si los indicadores básicos de las reglas del juego están establecidos adecuadamente.
Por ejemplo, el diseño del sistema de incentivos de la empresa tiene recompensas demasiado fuertes, incluidas tenencias de acciones y opciones. Todos los empleados de la empresa se hicieron millonarios. Por no hablar del elevado coste, la motivación de los empleados no es necesariamente alta. Esto es equivalente a la situación descrita en el "Juego del Cerdo Inteligente"
El plan incremental.
Sin embargo, si las recompensas no son grandes y el público recibe una parte (incluso los "cerditos" que no trabajan), los cerdos grandes que han trabajado duro no tendrán motivación, al igual que en la primera fase del programa "Smart Pig". Situación del plan de reducción de juego" descrita en. El mejor diseño de mecanismo de incentivos es como cambiar a la tercera opción: reducir el personal y agregar turnos. Las recompensas no son compartidas por todos, sino que están dirigidas a individuos (como las comisiones porcentuales comerciales), lo que no solo ahorra costos (para la empresa), sino que también elimina el fenómeno del "gorrón" y puede lograr incentivos efectivos.
Muchas personas no han visto la historia del "Juego del cerdo inteligente", pero están utilizando conscientemente estrategias de cerdos. Los inversores minoristas esperan que el banquero suba al sedán en el mercado de valores; esperan que aparezcan nuevos productos rentables en el mercado industrial y luego copian el dinero especulativo a gran escala para obtener enormes ganancias de personas de la empresa que no crean; beneficios pero comparten los resultados, etc. Por tanto, quienes formulan diversas reglas de juego para la gestión económica, deben comprender las razones de los cambios exponenciales en el "Juego del Cerdo Inteligente".
3. Conocimientos previos: Principios y aplicaciones de la teoría de juegos de Nash.
Beijing Evening News
Los dos importantes artículos de Nash sobre teoría de juegos no cooperativos en 1950 y 1951 cambiaron por completo las opiniones de la gente sobre la competencia y los mercados. Demostró el juego no cooperativo y su solución de equilibrio, y demostró la existencia de la solución de equilibrio, que es el famoso equilibrio de Nash. Esto revela la relación intrínseca entre el equilibrio del juego y el equilibrio económico. La investigación de Nash sentó la piedra angular de la teoría de juegos no cooperativa moderna, y las investigaciones posteriores sobre la teoría de juegos básicamente siguieron esta línea principal. Sin embargo, el genial descubrimiento de Nash fue rechazado categóricamente por von Neumann. Antes también había recibido una fría acogida por parte de Einstein. Pero la naturaleza de desafiar y despreciar la autoridad en su corazón le permitió a Nash apegarse a su propio punto de vista y eventualmente convertirse en un maestro. Si no hubiera sido por más de treinta años de enfermedad mental grave, me temo que habría subido al podio del Premio Nobel. Nunca compartiré este honor con otros.
Nash fue un matemático de gran talento cuyas principales aportaciones las realizó mientras estudiaba su doctorado en Princeton entre 1950 y 1951. Pero su genio descubrió que el equilibrio de los juegos no cooperativos, el "equilibrio de Nash", no siempre era fácil.
En 1948, Nash fue a la Universidad de Princeton para realizar un doctorado en matemáticas. En ese momento aún no tenía 20 años. En ese momento, Princeton estaba lleno de personas y maestros destacados. Einstein, von Neumann, Levshetz (presidente del Departamento de Matemáticas), Albert Tucker, Alonzo Cech, Harold Kuhn, Norman Steen Lord Si, Elf Fox, etc. Está todo aquí. La teoría de juegos fue creada principalmente por von Neumann (1903-1957). Era un talentoso matemático nacido en Hungría. No sólo creó la teoría de juegos económicos, sino que también inventó la computadora. Ya a principios del siglo XX, Zermelo, Borel y von Neumann comenzaron a estudiar expresiones matemáticas precisas de los juegos. No fue hasta 1939 que von Neumann conoció al economista Oscar Morgenstern y colaboró con él para llevar la teoría de juegos al amplio campo de la economía.
En 1944, se publicó su obra maestra "Teoría de juegos y comportamiento económico", en coautoría con Oscar Morgenstern, que marcó la formación inicial de la teoría de juegos de sistemas moderna. Aunque las investigaciones sobre la naturaleza de los juegos se remontan al siglo XIX o incluso antes. Por ejemplo, el juego de duopolio simple de Cournot en 1838; Bertrand en 1883 y Edgeworth en 1925 estudiaron la producción y el monopolio de precios de dos oligarcas. Hace más de 2.000 años, Sun Bin, un descendiente del famoso estratega militar de mi país, Sun Wu, utilizó la teoría de juegos; ayudar a Tian Ji a ganar la carrera de caballos, etc., son todas las semillas de la teoría de juegos temprana, que se caracteriza por investigaciones esporádicas, altas posibilidades y ningún sistema. Los conceptos y métodos analíticos de soluciones de modelos de juegos estándar, extendidos y cooperativos propuestos por von Neumann y Morgan Stern en su libro "Teoría de juegos y comportamiento económico" sentaron las bases teóricas de esta disciplina. Los juegos cooperativos alcanzaron su apogeo en la década de 1950. Sin embargo, las limitaciones de la teoría de juegos de Neumann están cada vez más expuestas. Debido a que es demasiado abstracto, su ámbito de aplicación es muy limitado. Durante mucho tiempo, la gente ha sabido poco sobre la investigación sobre la teoría de juegos. La teoría de juegos es sólo la patente de unos pocos matemáticos, por lo que su influencia es muy limitada. Fue en este momento cuando surgió el juego no cooperativo "equilibrio de Nash", que marcó el comienzo de una nueva era en la teoría de juegos. Nash no es un estudiante paso a paso. A menudo faltaba a la escuela. Según los recuerdos de sus compañeros de clase, no recordaban cuándo tomaron un curso completo requerido con Nash, pero Nash argumentó que al menos tomó la topología algebraica de Steen Rhodes. Steen Rhodes fue el fundador de la disciplina, pero después de tomar algunas clases, Nash decidió que no era de su agrado. Entonces se fue de nuevo. Sin embargo, después de todo, Nash es una persona extraordinaria y con talento. Está profundamente fascinado por todas las ramas del reino matemático, como la topología, la geometría algebraica, la lógica, la teoría de juegos, etc. Nash a menudo mostraba su distintiva confianza en sí mismo y su arrogancia, llena de agresivas ambiciones académicas. Durante todo el verano de 1950, Nash estuvo ocupado con intensos exámenes y su investigación sobre la teoría de juegos se vio interrumpida. Sintió que esto era un gran desperdicio. No sabía que esta "rendición" temporal, bajo el pensamiento constante de la mente subconsciente, gradualmente ha formado un contexto claro, ¡y de repente estalla la inspiración! En octubre de este año, de repente sintió una oleada de talento y sueños. Lo más destacado es el concepto de equilibrio de juego no cooperativo, que en el futuro se denominará "equilibrio de Nash".
Las principales contribuciones académicas de Nash se reflejan en dos artículos (incluida una tesis doctoral) en 1950 y 1951. No fue hasta 1950 que redactó los resultados de su investigación en una larga tesis doctoral titulada "Juegos no cooperativos" y la publicó en los "Avisos mensuales de la Academia Nacional de Ciencias" en 19501, que inmediatamente causó sensación. Hablando de eso, todo depende del trabajo del hermano David Gale. Apenas unos días después de ser degradado por von Neumann, conoció a Gale y le dijo que había avanzado la "solución maximin" de von Neumann al campo de los juegos no cooperativos y había encontrado métodos de solución universal y puntos de equilibrio. Gale escuchó con atención. Finalmente se dio cuenta de que la idea de Nash reflejaba la situación real mejor que la teoría de juegos cooperativos de von Neumann, y su rigurosa y hermosa demostración matemática le dejó una profunda impresión. Gale sugirió que lo resolviera y lo publicara inmediatamente antes de que alguien llegue primero. Nash, un niño novato, no conocía los peligros de la competencia y nunca pensó en hacerlo. Entonces Gale actuó como su "agente" y redactó un mensaje de texto a la Academia de Ciencias en su nombre. El jefe del departamento, Lev Shetz, entregó personalmente el manuscrito a la Academia de Ciencias. Nash no escribió muchos artículos, sólo unos pocos, pero fueron suficientes porque todos estaban entre los mejores. También vale la pena reflexionar sobre esto. ¿Cuántos artículos necesita publicar un profesor nacional en "revistas principales"? Según este estándar, es posible que Nash no esté calificado.
Morris, ganador del Premio Nobel de Economía entre 1996 y 1965, no publicó ningún artículo cuando fue profesor Edgeworth de Economía en la Universidad de Oxford. Los talentos especiales requieren métodos de selección especiales.
Nash comenzó a estudiar teoría de juegos matemáticos puros cuando estaba en la universidad desde 65438 hasta 0948, y se sintió más cómodo después de ingresar a la Universidad de Princeton. Cuando tenía poco más de veinte años, se había convertido en un matemático de fama mundial. Especialmente en el campo de la teoría de juegos económicos, hizo contribuciones que marcaron época y es uno de los mayores maestros de la teoría de juegos después de von Neumann. Su famoso concepto de equilibrio de Nash juega un papel central en la teoría de juegos no cooperativos. Las contribuciones de investigadores posteriores a la teoría de juegos se basaron en este concepto. La propuesta y la mejora continua del equilibrio de Nash han sentado una base teórica sólida para la amplia aplicación de la teoría de juegos en economía, gestión, sociología, ciencias políticas, ciencias militares y otros campos.
El dilema del prisionero:
Acerca del "dilema del prisionero"
En teoría de juegos, un ejemplo famoso de equilibrio estratégico dominante es el juego "Dilema del prisionero" de Tucker. modelo. Este modelo nos cuenta la historia de un policía y un ladrón de una forma especial. Supongamos que dos ladrones, A y B, cometen un delito juntos y entran en una casa privada, pero son atrapados por la policía. La policía encerró a los dos hombres en dos habitaciones separadas para interrogarlos. Para cada sospechoso, la política dada por la policía es que si un sospechoso confiesa su delito y entrega los bienes robados, y las pruebas son concluyentes, ambos serán condenados. Si el otro sospechoso también confiesa, cada uno será sentenciado a ocho años de prisión; si el otro sospechoso niega sin confesar, será sentenciado a otros dos años por obstruir asuntos oficiales (porque hay pruebas que prueban su culpabilidad). La persona que confesó fue inmediatamente puesta en libertad tras una pena reducida de ocho años. Si ambos lo niegan, la policía no puede condenarlos por robo por falta de pruebas, pero cada uno puede ser sentenciado a un año de prisión por invasión de propiedad privada. La tabla 2.2 muestra la matriz de pagos de este juego.
Tabla 2.2 Juego del dilema del prisionero
B
Admitir negación
una confesión –8, –8 0, –10
Rechaza –10, 0–1, –1
Veamos cuál es el equilibrio predecible de este juego. Para A, aunque no sabe qué elige B, sabe que no importa lo que elija B, elegir "confesarse" siempre será lo mejor para él. Obviamente, basándose en la simetría, B también elegirá "confesión". Como resultado, ambos hombres fueron condenados a 8 años de prisión. Pero si todos eligen "negar", cada persona sólo será condenada a 1 año. Entre las cuatro combinaciones de opciones de acción de la tabla 2.2, (negar, negar) es óptima de Pareto, porque cualquier otra combinación de opciones de acción que se desvíe de esta combinación de opciones de acción empeorará la situación de al menos una persona. No es difícil ver que la "confesión" es la estrategia dominante para cualquier sospechoso de haber cometido un delito, y (confesar, declararse culpable) es un equilibrio estratégico dominante.
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?
Una breve historia sobre la teoría de Dalí
Para entender la contribución de Nash, primero debemos saber qué es un problema de juego no cooperativo. En la actualidad, casi todos los libros de texto de teoría de juegos hablarán sobre el ejemplo del "dilema del prisionero", y los ejemplos de todos los libros son similares.
La teoría de juegos es, después de todo, matemáticas o, en otras palabras, una rama de la investigación operativa. Cuando se habla de clásicos y doctrinas, el lenguaje matemático es naturalmente indispensable para los profanos, son solo muchas fórmulas matemáticas. Afortunadamente, la teoría de juegos se centra en la vida económica diaria y no podemos dejar de comer fuegos artificiales. Esta teoría es en realidad un término tomado del ajedrez, el póquer, la guerra y otros problemas relacionados con la naturaleza de la competencia, la confrontación y la toma de decisiones. Suena un poco misterioso, pero en realidad tiene un importante significado práctico. Los maestros de la teoría de juegos analizan las cuestiones económicas y sociales de la misma manera que juegan al ajedrez y, a menudo, tienen verdades profundas en el juego. Por lo tanto, no es aburrido empezar con asuntos triviales de la vida diaria y utilizar las historias que nos rodean como ejemplos para explicar. Un día, un hombre rico fue asesinado en su casa y le robaron su propiedad.
Durante la investigación de este caso, la policía capturó a dos sospechosos, Scare y Nakuls, y encontró los objetos perdidos en la casa de la víctima en sus residencias. Pero negaron haber matado a alguien, argumentando que primero mataron a los ricos y luego simplemente robaron cosas. Entonces la policía aisló a las dos personas y las metió en habitaciones diferentes para interrogarlas. El fiscal de distrito hablará con cada persona individualmente. El fiscal dijo: "Como tiene pruebas concluyentes de robo, puedo sentenciarlo a un año de prisión", pero puedo llegar a un acuerdo con usted. Si usted hubiera admitido únicamente el asesinato, sólo le habría condenado a tres meses de prisión, pero su cómplice habría sido condenado a diez años de prisión. Si te niegas a confesar y eres denunciado por tu pareja, serás condenado a diez años de prisión, y él sólo será condenado a tres meses de prisión. Sin embargo, si ambos confiesan, ambos serán sentenciados a cinco años de prisión. "¿Qué deberían hacer Scalfi y Nacoors? Se enfrentan a un dilema: confesar o negar. Es obvio que la mejor estrategia para ambas partes es negar, y cada uno recibe sólo un año de prisión. Pero como los dos están aislados, no pueden confesar. Entonces, según la teoría de Adam Smith, todos están motivados por el interés propio y eligen la confesión como la mejor estrategia porque si confiesas, puedes esperar una pena corta de tres meses de prisión, pero sólo si lo haces. Si tu pareja lo niega, obviamente es mejor que 10 años de prisión si tú mismo lo niegas. Esta estrategia es perjudicial para los demás. No sólo eso, sino que confesar tiene más beneficios, ¡así que no vale la pena, en este caso! aun así debes optar por confesar, incluso si dos personas confiesan al mismo tiempo, solo serán sentenciadas a cinco años como máximo, que es mejor que 10 años. Por lo tanto, la opción razonable para ambos es confesar, lo cual es una estrategia. eso es beneficioso para ambas partes) y el resultado (sentencia a 1 año de prisión) no aparecerá. De esta manera, el resultado de que ambas personas elijan la estrategia de Frank y sean sentenciadas a cinco años se llama "equilibrio de Nash". Se llama equilibrio no cooperativo, porque cada parte elige una estrategia, no hay "colusión" (colusión), simplemente eligen la estrategia que les resulta más beneficiosa, sin considerar el bienestar social ni los intereses de ningún otro oponente. En otras palabras, esta combinación de estrategias está determinada por todos los participantes (también conocido como "El dilema del prisionero" tiene un significado amplio y profundo para todos. La búsqueda del interés propio conduce a un "equilibrio de Nash", que también es un resultado desfavorable). Para todos, ambos piensan en sí mismos primero en la estrategia de la confesión, por lo que deben cumplir una sentencia larga o confabularse entre sí para obtener el resultado de la sentencia de prisión más corta. El equilibrio de Nash desafía primero la "mano invisible" de Adam Smith. Según la teoría de Smith, en una economía de mercado todos tienen interés propio, a partir del propósito, toda la sociedad eventualmente logrará un efecto altruista. Repasemos el famoso dicho de este sabio económico en "La riqueza de las naciones". : "Al perseguir el interés propio (individual), a menudo promueve los intereses sociales de manera más efectiva de lo que realmente quiere". "Del 'equilibrio de Nash' se deriva una paradoja del principio de la 'mano invisible': a partir del interés propio, el resultado no es el interés propio, ni el interés propio ni el interés propio. Éste es el destino de los dos prisioneros En este sentido, Nash La paradoja planteada por el equilibrio en realidad sacude los cimientos de la economía occidental. Por lo tanto, del equilibrio de Nash también podemos entender una verdad: la cooperación es una "estrategia de interés propio" beneficiosa, pero debe cumplir con lo siguiente. Regla de oro: quieres que los demás lo hagan. Trata a los demás como quieres que te traten a ti, pero sólo si los demás hacen lo mismo. Eso es lo que dicen los chinos: "No hagas a los demás lo que no quieres que yo haga". "Pero la premisa es que no me hagas lo que no quieres que haga. En segundo lugar, el "equilibrio de Nash" es un equilibrio de juego no cooperativo. En realidad, las situaciones no cooperativas son más comunes que las situaciones no cooperativas. situaciones cooperativas. Por lo tanto, el "equilibrio de Nash" es un desarrollo importante de la teoría del juego cooperativo de von Neumann y Morgan Stern, incluso se puede decir que es una revolución
Desde el sentido general del equilibrio de Nash. Puede tener una comprensión profunda de los fenómenos comunes del juego en la economía, la sociedad, la política, la defensa nacional, la gestión y la vida cotidiana. Ejemplos similares al "dilema del prisionero", como la guerra de precios, la competencia militar, la contaminación, etc. de tres elementos: los jugadores, también conocidos como partidos, el conjunto de participantes y estrategias, el conjunto de estrategias y las elecciones realizadas por cada jugador.