La IA demuestra capacidades de reconocimiento del lenguaje labial gracias al big data
Los humanos han estado estudiando e investigando el lenguaje labial durante mucho tiempo. Sin embargo, debido a la influencia de la experiencia, la vista y factores subjetivos, la precisión de la lectura de los labios humanos es inestable. Por lo tanto, dejar que la IA aprenda a "leer los labios" tiene una importancia práctica en muchos escenarios de aplicación.
La lectura de labios es una habilidad particularmente difícil. Cuando las personas leen los labios, juzgan tanto como sea posible basándose en la conexión entre las palabras. El propio conocimiento del lenguaje del lector de labios también es crucial. La "lectura de labios" de IA es simplemente una tecnología de reconocimiento de labios. La computadora utiliza el reconocimiento visual y el procesamiento del lenguaje natural para analizar los movimientos de los labios del hablante e identificar el contenido del discurso.
El Departamento de Informática de la Universidad de Oxford ha desarrollado un sistema de inteligencia artificial llamado LipNet. Según los informes, este sistema de inteligencia artificial se basa en un conjunto de datos llamado "GRID". El equipo de investigación utilizó este conjunto de datos para entrenar redes neuronales para inteligencia artificial, que a menudo se utilizan para el reconocimiento de idiomas. A medida que pasa el tiempo, la red neuronal de la IA reconoce cada vez más formas de boca y poco a poco irá comprendiendo la información que reconoce. La IA no solo reconocerá fragmentos de metraje, sino que integrará la información que reconoce basándose en la idea general de todo el discurso; Analiza automáticamente oraciones según el contexto para comprender la esencia de todo el discurso.
En los últimos años, muchas empresas nacionales como Haiyun Data y Sogou también han lanzado tecnología de reconocimiento de labios. La tecnología de reconocimiento de labios puede desempeñar un papel muy importante en muchos campos, como la seguridad pública, la inteligencia militar y el bienestar público.
Un sistema de reconocimiento de labios maduro requiere una gran cantidad de datos de muestra de características faciales. Estos datos deben contener tantas escenas y más tipos de hablantes como sea posible para garantizar que el sistema de reconocimiento de labios entrenado tenga una mejor capacidad de generalización. .