Red de conocimiento del abogados - Bufete de abogados - ¿AlphaGo realmente entiende Go?

¿AlphaGo realmente entiende Go?

Estoy muy de acuerdo con esta frase: es posible que todavía no puedas aceptar AlphaGo de esta manera. Creo que esto se debe a que cuando las personas juegan Go, primero deben entender qué es "Go" antes de poder operar. él. Pero AlphaGo no sabía (o no recibió datos) que "Go es un juego jugado por dos personas cara a cara, de confrontación, de suma cero, y el tablero es de 19*19. El tablero es cuadrado y la parte superior es Al jugar en una cuadrícula, la cuadrícula también es cuadrada. Si hay dos piezas, blanca y negra, la pieza negra se jugará primero. Las dos piezas deben jugarse por turnos. Deben colocarse en los puntos de la cuadrícula en lugar de en el. En el medio de la cuadrícula hay requisitos de tiempo limitados y la cantidad de piezas de ajedrez es suficiente. No es necesario jugar una pieza. Las piezas de ajedrez son redondas y convexas en ambos lados. Juego inventado en la antigua China. Puede derrotar a los humanos en cualquier punto del juego.

En primer lugar, creo que AlphaGo puede entender Go.

Las computadoras tienen tales regulaciones para el Go (definidas por las reglas de Tromp-Taylor). El Go se juega en una cuadrícula de 19*19. Dos jugadores, "Xiao Hei" y "Xiao Bai", se turnan para jugar. juego respectivamente. Un juego en el que un determinado punto de la cuadrícula en el tablero de ajedrez es de color negro o blanco. Junto con las reglas de levantamiento y bucles prohibidos, así como el juicio final, es la regla completa de Tromp-Taylor. ¿Existe alguna diferencia esencial entre este tipo de Go y el Go a nuestros ojos? Si no se tiene en cuenta la cultura Go, definitivamente puedo decir que no hay diferencia.

Entonces, ¿por qué AlphaGo atrae tanta atención? Algunas personas dicen que la última frontera de la humanidad se ha perdido, y algunas incluso dicen que la inteligencia artificial reemplazará a los humanos. Respuesta: Go es uno de los juegos más complejos del mundo. Como dice el refrán, "Un movimiento descuidado conducirá a la pérdida del juego". En términos generales, la toma de decisiones de una jugada de ajedrez se divide en dos pasos. El primer paso, "selección de puntos": otorga varios puntos a los candidatos según la experiencia o el sentimiento; el segundo paso, "juicio": emita juicios formales sobre estos puntos y compárelos. Estos dos pasos son fáciles de decir, pero para alcanzar el nivel de un experto superior, los requisitos de talento y diligencia no son menores que los que requiere un excelente matemático.

AlphaGo es un programa de inteligencia artificial Go desarrollado por Demis Hassabis, David Silva, Huang Shijie y su equipo de DeepMind, una filial de Google. Su principal principio de funcionamiento es el "aprendizaje profundo".

Entonces, ¿qué es el "aprendizaje profundo"? El concepto de aprendizaje profundo tiene su origen en la investigación de redes neuronales artificiales. Un perceptrón multicapa con múltiples capas ocultas es una estructura de aprendizaje profundo. El aprendizaje profundo descubre representaciones de características distribuidas de datos mediante la combinación de características de bajo nivel para formar características o categorías de atributos de representación de alto nivel más abstractas. El aprendizaje profundo es un método de aprendizaje automático basado en el aprendizaje de representación de datos. Una observación (como una imagen) se puede representar de diversas formas, como un vector de valores de intensidad para cada píxel, o de manera más abstracta como una secuencia de aristas, una región de una forma específica, etc. Las tareas (por ejemplo, reconocimiento facial o reconocimiento de expresiones faciales) son más fáciles de aprender a partir de ejemplos que utilizan determinadas representaciones. El beneficio del aprendizaje profundo es reemplazar la adquisición manual de funciones con algoritmos eficientes para el aprendizaje de funciones no supervisado o semisupervisado y la extracción jerárquica de funciones. El aprendizaje profundo es un nuevo campo en la investigación del aprendizaje automático. Su motivación es construir y simular la red neuronal del cerebro humano para el análisis y el aprendizaje. Imita el mecanismo del cerebro humano para interpretar datos, como imágenes, sonidos y texto. Al igual que los métodos de aprendizaje automático, los métodos de aprendizaje automático profundo también se dividen en aprendizaje supervisado y aprendizaje no supervisado. Los modelos de aprendizaje establecidos bajo diferentes marcos de aprendizaje son muy diferentes. Por ejemplo, las redes neuronales convolucionales (CNN para abreviar) son un modelo de aprendizaje automático bajo aprendizaje supervisado profundo, mientras que las redes neuronales profundas (DBN para abreviar) son un modelo de aprendizaje automático bajo aprendizaje no supervisado.

Es precisamente gracias a este "aprendizaje profundo" que AlphaGo ha aprendido el profundo y profundo juego del Go. Es precisamente gracias al "aprendizaje profundo" que AlphaGo ha pasado de ignorar el Go a desafiarlo. los mejores jugadores del mundo.

Entonces, ¿por qué la gente juega al Go?

Cuando la gente juega al ajedrez, cada paso de la decisión de ajedrez se realiza mediante sumas y restas de señales similares. Tenemos un juicio de valor sobre el estado actual del tablero y un juicio sobre la probabilidad de victoria o derrota.

Al jugar al ajedrez en diferentes cuadrículas, esta elección también se basa en la experiencia, para diferentes cuadrículas existen diferentes estimaciones del aumento y la caída de la probabilidad de victoria o derrota. Al mismo tiempo, también usaremos la experiencia para predecir los movimientos del oponente en las próximas rondas. Cuanta más experiencia tengan los expertos, más clara será su capacidad para juzgar el valor en estos tres aspectos.

Cuando entré en contacto con Go por primera vez, tenía poca capacidad para predecir estas cosas, o era muy inexacto, porque no había posibilidad de experimentar situaciones similares; A medida que se familiarice con él paso a paso, conservará más recuerdos de estado. Le recordará lo que ha experimentado antes. Sólo entonces podremos juzgar con mayor precisión el valor de las diferentes opciones. No importa cuán profesionales sean las personas, no necesitan pensar en ello deliberadamente, se ha vuelto subconsciente. Mis pensamientos se han dirigido a la superestructura y a los niveles superiores. Siempre que cometes un error o no sabes cómo ir, es porque todavía te faltan conceptos en cierto nivel, o no has experimentado la situación y no puedes reconocer el patrón. AlphaGo también está construyendo su propia precisión de juicio paso a paso mediante métodos de aprendizaje similares. Los pesos de la red neuronal corresponden a las "reglas" aprendidas por los humanos. Hay razones para su nivel de reglas y decisiones finales. Quienes tienen experiencia también tienen "comprensión". No muy diferente de la comprensión humana.