Red de conocimiento del abogados - Ley de patentes - 100:0, ¿el nuevo AlphaGo renunció a los humanos?

100:0, ¿el nuevo AlphaGo renunció a los humanos?

01

El 19 de octubre de 2017, DeepMind, filial de Google, lanzó una nueva versión de AlphaGo. Mucha gente sabe que AlpoaGo es un programa de inteligencia artificial, pero no saben que en realidad es una familia. Fue AlphaGo Lee quien derrotó al jugador coreano Lee Sedol en los primeros días. Fue AlphaGo Master quien derrotó al campeón mundial Ke Jie en Wuzhen. Lo que se lanzó esta vez fue AlphaGo Zero. Después de 3 días de entrenamiento, derrotó a su hermano AlphoGo Lee con un récord de 100:0. Después de 40 días de entrenamiento, derrotó a su otro hermano AlphoGo Master.

En comparación con las versiones anteriores, la mayor diferencia entre AlphaGo Zero es que ya no depende de la guía humana para crecer. Es decir, el AlphaGo Lee anterior dependía de una gran cantidad de registros de ajedrez ingresados ​​manualmente para ayudarlo. aprender a jugar ajedrez, para decirlo sin rodeos, aprende bajo la guía de personas y puede entenderse como estudiantes enseñados por humanos a través de miles de años de experiencia en Go.

AlphaGo Zero utiliza un algoritmo de aprendizaje por refuerzo, es decir, ya no depende de ningún registro de ajedrez. Una vez que el programador ingresa las reglas básicas de Go, ya no habrá ninguna enseñanza. Le pidió que explorara y resumiera el método de jugar al ajedrez, que es bastante la inteligencia artificial de Yu aprende completamente de acuerdo con su propio método. AlphaGo Lee fue completamente derrotado por AlphaGo Zero, que abandonó la experiencia humana. Esto muestra que la experiencia humana puede haber engañado a AlphaGo Lee, limitando así su desarrollo.

El estilo de juego de ajedrez de AlphaGo Zero es muy similar al de los jugadores humanos en las etapas inicial y final, y el estilo de juego de ajedrez en el juego es de hecho significativamente diferente al de los jugadores humanos y a las versiones anteriores de AlPhaGo es diferente, y es esta diferencia la que le permite permanecer invicto en 100 batallas con AlphaGo Lee. En otras palabras, si AlphaGo Lee no adorara a los humanos como sus maestros, sino que aprendiera de las máquinas, entonces tendría una mayor potencia informática. AlphaGo Lee, el resultado aún no está claro.

Además del aprendizaje sin experiencia, otra característica importante de AlphaGo Zero es la integración de las dos redes neuronales de la versión anterior de AlphaGo. En la versión anterior de AlphaGo, la forma de jugar al ajedrez estaba determinada por. ¿La "red estratégica" y la "red de valor" son dos redes neuronales para calcular cómo jugar al ajedrez? Es decir, primero, la "red estratégica" utiliza la experiencia acumulada para juzgar qué posiciones son adecuadas para jugar al ajedrez en el tipo de ajedrez actual. Luego, la "red de valor" determina estas posiciones. Después de simular el movimiento de posición, se calcula la tasa de ganancia y finalmente se selecciona la posición del movimiento.

AlphaGo Zero integra los dos y hace pleno uso de la extracción de características y otros módulos de las dos redes anteriores. ¿Puede dar los resultados correspondientes al calcular las posibles posiciones de ajedrez?, mejorando enormemente la eficiencia y la eficiencia. reduciendo el tiempo necesario para la formación. Esta es una de las principales razones por las que AlphaGo Zero derrotó a AlphaGo Lee, que había estado entrenando durante varios meses, en sólo tres días de entrenamiento.

La inteligencia artificial no solo es el punto culminante del desarrollo en el campo de la informática, sino que también tiene un potencial y un valor de aplicación ilimitados en todas las industrias. Actualmente, los países de todo el mundo son generalmente optimistas en cuanto a que la tecnología de inteligencia artificial prosperará. convertirse en una oportunidad para la próxima revolución tecnológica. Incluso si la inteligencia artificial no alcanza al final un nivel revolucionario de disrupción, la IA ya está cambiando nuestras vidas gradualmente.

En el pasado, el progreso de la inteligencia artificial se basaba en el desarrollo simultáneo de software y hardware. El algoritmo de red neuronal se propuso por primera vez a mediados del siglo pasado, pero limitado por la potencia informática. El algoritmo de red neuronal ha seguido desarrollándose lentamente.

Más tarde, a medida que la velocidad de computación del hardware siguió aumentando, los algoritmos de software existentes se implementaron y mejoraron continuamente. Los algoritmos mejorados tenían mayores requisitos de hardware, lo que promovió aún más el desarrollo del hardware y la aparición de AlphaGo. Cero Completamente basado en actualizaciones de algoritmos.

La versión anterior de AlphaGo requirió varios meses de aprendizaje sobre 48 TPU (chips desarrollados por Google específicamente para acelerar la potencia informática de las redes neuronales profundas, cada uno de los cuales cuesta hasta 5 millones de dólares), mientras que AlphaGo Zero solo Se necesitan 4 TPU y unos días para completar el aprendizaje. Esta capacidad de aprendizaje sin experiencia es muy adecuada para aplicaciones en el plegamiento de proteínas y otros campos médicos que carecen de muestras, y bien puede resolver el problema del lento progreso de la investigación debido a la falta de muestras de prueba. En futuras investigaciones relacionadas, puede ingresar completamente las reglas y usar las capacidades de AlphaGo Zero para simular y, finalmente, usar muestras limitadas para la verificación.

La ruta de actualización gradual de AlphaGo

A estas alturas de la historia, realmente tengo que admirar la profunda fortaleza técnica y la astuta visión comercial de Google. AlphaGo ha sido cuidadosamente empaquetado por el equipo de Deepmind desde su nacimiento. Mirando hacia atrás detenidamente, se puede decir que está "profundo en las rutinas urbanas".

Desde su victoria inicial sobre ajedrecistas profesionales de bajo nivel hasta el calentamiento o la exageración, hasta su victoria sobre el mejor jugador humano Lee Sedol, el debut de AlphaGo ha sido bastante magnífico. Sin embargo, la puntuación de 4 a 1 todavía le dio a la humanidad un rayo de esperanza. En esta única victoria, Li Shishi tomó el lado equivocado y obligó directamente a AlphaGo a sufrir síntomas de "cortocircuito cerebral". suficiente en este momento, aún no era lo suficientemente poderoso. Desde entonces, maestros humanos de todos los ámbitos de la vida han comenzado a trabajar duro para estudiar las rutinas de AlphaGo, con la esperanza de recuperar la dignidad humana.

Posteriormente, un misterioso "maestro" logró un impresionante récord de 60 victorias y 0 derrotas en la plataforma de batalla de los mejores jugadores del mundo de Go. ¿Quién es este maestro? ¿Es un humano o un monstruo? Ha captado la atención de las masas. No fue hasta que se lograron las magníficas 60 victorias que finalmente se reveló el misterio.

Lo que siguió fue un enfrentamiento en Wuzhen que atrajo la atención del mundo. AlphaGo Master venció a Ke Jie hasta que no pudo defenderse. Aunque Ke Jie ha demostrado el verdadero poder de lucha del ser humano más fuerte, AlphaGo todavía lo reprime por completo. Si comete algún error en sus movimientos, inmediatamente caerá en la trampa de la estrategia de "victoria con ventaja mínima" de AlphaGo, y allí. no habrá lugar para la recuperación.

Después del enfrentamiento en Wuzhen, los humanos se rindieron por completo en el campo de Go. Sin mencionar a Ke Jie solo, los cinco maestros unieron fuerzas y perdieron más rápido de lo que Ke Jie se hizo famoso por un tiempo.

Ahora, justo cuando el humo en Wuzhen está a punto de disiparse, ¡Google ha hecho otra gran noticia! Después de que la inteligencia artificial abandonara la experiencia humana, AlphaGo Zero, que se enseñó a sí mismo en tres días, derrotó miles de años de experiencia humana. La versión evolucionada de AlphaGo derrotó a la versión original. Recuerda a la gente el emocionante combate de mechas en "Iron Armor". Una IA perdió ante otra IA más poderosa, y la IA china derrotó a la IA estadounidense. escenario real en futuras competiciones de ajedrez.