Red de conocimiento del abogados - Bufete de abogados - Informe sobre tecnología de voz de 2019: La escala de la economía de la voz superará a la de las aplicaciones móviles.

Informe sobre tecnología de voz de 2019: La escala de la economía de la voz superará a la de las aplicaciones móviles.

Recientemente, la institución de inversión estadounidense Mangrove Capital Partners publicó esta semana el Informe de tecnología de voz 2019. El informe, "Voice: Bienvenido a la próxima generación de disruptores", analiza la creciente popularidad de los servicios de asistente de voz y hace predicciones interesantes sobre las tendencias de Siri en 2020.

El siguiente es el texto completo del informe compilado por Tencent Technology:

Después de años de escribir con el teclado y hacer clic en las pantallas de los teléfonos móviles, volvemos a la "interfaz de usuario" original. : voz. Si bien todavía no hemos sentido el impacto total de la tecnología de voz, está cambiando la forma en que interactuamos con el mundo digital.

Es importante destacar que este cambio afecta a mucho más que simplemente consultar el pronóstico del tiempo, escuchar música y configurar alarmas. La voz revoluciona las plataformas y las interfaces de usuario a la par de la web y los teléfonos inteligentes. Como puerta de entrada a la inteligencia artificial y el aprendizaje automático, la tecnología de voz nos servirá de nuevas y poderosas formas.

En Mangorve, creemos que la pronunciación será uno de los temas definitorios en los próximos 10 años. Además de impactar a varias industrias con servicios digitales, la tecnología de voz también fomentará una nueva generación de empresas tecnológicas. La tecnología de voz, junto con la inteligencia artificial, cambiará fundamentalmente la relación entre humanos y máquinas y creará un enorme valor para la próxima generación de software.

Desde que Apple lanzó Siri en 2011, la tecnología de voz ha avanzado mucho. Con el desarrollo del aprendizaje automático, hemos logrado grandes avances en el reconocimiento de voz (voz a texto) y el procesamiento del lenguaje natural (reconocimiento de instrucciones en texto). De hecho, la tasa de precisión del reconocimiento de palabras de los sistemas de voz ha superado el 95%, lo que significa que ya tienen capacidades de comprensión del lenguaje similares a las de los humanos. En comparación con la escritura, los productos de voz brindan una forma de comunicación más natural, conveniente y eficiente. Por lo tanto, la voz está destinada a convertirse en la interfaz de interacción persona-computadora más importante.

Según Juniper Research, actualmente hay 2.500 millones de asistentes de voz en el mercado. A medida que los gigantes tecnológicos se apresuran a unirse a la contienda, cada vez más hogares recurren a los servicios de voz. En Estados Unidos, el número total de parlantes inteligentes domésticos aumentó un 78% en 2018, de 66,7 millones a 654,38+85,5 millones. La cuota de mercado de Amazon alcanzó el 64,6%. Conaz predice que para 2023, la capacidad global instalada de parlantes inteligentes aumentará a 500 millones.

La voz también se está convirtiendo en la puerta de entrada a los hogares inteligentes y al Internet de las Cosas. Amazon anunció que 4.500 marcas ya ofrecen 28.000 dispositivos domésticos inteligentes habilitados para Alexa, incluidos televisores, cocinas y robots aspiradores. Además de entrar en el ámbito doméstico, los asistentes de voz también están llegando a las habitaciones de Marriott y de otros hoteles, y también son muy populares en los sistemas de información y entretenimiento de los automóviles. Amazon está en conversaciones con varias empresas de automóviles. Se informa que los pedidos de preventa del producto para automóviles Echo Auto de Amazon han superado los 10.000. Echo Auto brinda una experiencia completa de manos libres, que incluye realizar llamadas telefónicas, navegar y controlar dispositivos domésticos inteligentes.

La tecnología de la voz también está trascendiendo las barreras del idioma. Actualmente, los servicios de Google admiten 30 idiomas e incluso pueden comprender varios idiomas hablados por los usuarios al mismo tiempo. Curiosamente, los servicios de voz se están afianzando más rápidamente en China, donde Alibaba lidera el mercado de altavoces inteligentes.

La aparición de varias aplicaciones populares recuerda al desarrollo inicial de la App Store. Las funciones ofrecidas por Amazon Alexa incluyen apoyo a la lactancia materna para nuevas madres, alentar a los niños a cepillarse los dientes, ayudar a los usuarios a hacer ejercicio, entrenar equipos de fútbol e instruir a las personas sobre cómo orar.

Las compras por voz también están creciendo ya que Amazon Alexa está directamente vinculada a una de las plataformas de comercio electrónico más grandes del mundo. Amazon observó que durante la temporada navideña de 2018, el volumen de transacciones de comercio electrónico en la plataforma Alexa se triplicó año tras año. Walmart lanzó recientemente un servicio de compra de alimentos frescos en línea basado en Google Voice Assistant. Los compradores pueden agregar productos a su carrito de compras a través de la página de inicio de Google, teléfonos inteligentes o relojes inteligentes.

Según datos de Juniper, en Estados Unidos y el Reino Unido, la escala del comercio electrónico de voz crecerá de 2 mil millones de dólares en 2018 a 40 mil millones de dólares en 2022. Curiosamente, las tres categorías de productos más populares para el comercio electrónico por voz son todas productos de bajo precio: alimentos frescos (20%), entretenimiento (19%) y productos electrónicos (17%).

Como resultado, será aún más importante para los minoristas alcanzar el estatus de "Elección de Amazon". Según O&C Strategy Consulting, el 85% de los compradores de Amazon terminan eligiendo productos recomendados por Amazon. Sin embargo, no está claro cómo productos específicos reciben tales recomendaciones.

Ya sea en línea o fuera de línea, la tecnología de voz ha estado guiando a los consumidores a comprar. Para escenarios como preparar cócteles y degustar whisky basándose en la experiencia de voz, los fabricantes de bienes de consumo están explorando cómo mejorar el posicionamiento del producto y la lealtad de los usuarios.

Es importante destacar que los servicios de voz están cambiando de transaccionales a conversacionales. El resultado final de esta tendencia es difícil de comprender por completo, pero puedes verlo de esta manera: nunca más te sentirás solo, ya sea que estés hablando con Alexa, otro ser humano o una inteligencia artificial.

La primera ola de IA utilizó algoritmos para crear motores de recomendación y proporcionar accesos directos a servicios de Internet como Google, Amazon y Facebook. La segunda ola es ayudar a las empresas a utilizar datos estructurados para optimizar el proceso de toma de decisiones. Empresas como Palantir comenzaron a crecer. Extraen grandes cantidades de datos estructurados y encuentran correlaciones en la información que son difíciles de detectar para el ojo y el cerebro humanos.

Se acerca la tercera ola de inteligencia artificial. La IA gana ojos, oídos y muchos otros sentidos, lo que le permite recopilar datos nuevos, nunca antes vistos, y luego utilizarlos para impulsar la automatización de procesos más complejos. Al mismo tiempo, también estamos pasando de un proceso estático basado en comandos a un proceso dinámico. Se trata de un cambio tectónico en la informática que revolucionará la forma en que experimentamos e interactuamos con el software, desdibujando la conexión entre los mundos digital y físico.

A medida que los sistemas de IA se vuelvan más hábiles en la conversación y recopilen más datos sobre las personas y el mundo que las rodea, podrán comprender la información contextual. Los humanos a menudo pueden captar fácilmente esta información relevante y aplicarla a las conversaciones. La información contextual ayudará a los humanos y las máquinas a interactuar y colaborar de una manera más natural. A medida que las experiencias se optimizan y se vuelven más útiles, interactúan con más frecuencia y las máquinas adquieren más conocimientos.

Este círculo virtuoso significa que en los próximos tres a cinco años, las capacidades conversacionales de las computadoras se volverán más complejas y revolucionarias. Podemos conversar fácilmente con la omnipresente inteligencia artificial en lugar de pasar tiempo escribiendo en teclados y mirando teléfonos inteligentes. Es importante destacar que la forma en que interactuamos con el software cambiará para siempre: la forma morirá y los puntos de contacto se convertirán en "puntos de escucha".

Esto puede explicar por qué las empresas tecnológicas más grandes del mundo están invirtiendo fuertemente en tecnología de voz. La tecnología de voz trae cambios de plataforma e interfaz de usuario que están a la par con las páginas web y teléfonos inteligentes anteriores, pero la única diferencia es que los usuarios no necesitan ninguna capacitación para pasar a la voz. Las grandes empresas tecnológicas no pueden permitirse el lujo de perder frente a esta futura plataforma dominante. Como resultado, Amazon tiene más de 65.438+0.000 empleados trabajando en proyectos de Alexa, y Amazon también es uno de los inversores más entusiastas en nuevas empresas de tecnología de voz.

El impacto de la tecnología de voz es de gran alcance y cada empresa necesitará repensar cómo interactuar con los usuarios. No se trata sólo de modificar el SEO (optimización de motores de búsqueda) o desarrollar sus propias “habilidades” de Alexa u “operaciones” de Google.

En última instancia, las empresas necesitan proporcionar una interfaz que tenga en cuenta el contexto y que dé prioridad a la voz. Las empresas que puedan construir conexiones cognitivas y emocionales entre los usuarios podrán involucrar mejor a los usuarios, mientras que las empresas que simplemente respondan pasivamente a las preguntas de los usuarios con guiones preestablecidos estarán en clara desventaja. Es posible que las empresas de tecnología que dependen en gran medida de las notificaciones para impulsar el uso de aplicaciones quieran revisar sus estrategias. Los consumidores ya no tendrán mucha paciencia con las empresas que utilizan demasiadas notificaciones para superar el "umbral del sonido" (como LinkedIn).

Las aplicaciones móviles más populares son las plataformas dominantes de hoy, y las interfaces de voz más atractivas para el usuario serán los servicios dominantes del mañana. Es difícil predecir cómo debería ser la interfaz ideal, pero es probable que la próxima generación de Airbnb, Monzo y Uber surja dentro de tres a cinco años.

La aparición de teléfonos móviles sin pantalla, como el Light Phone, nos muestra el futuro. Un teléfono así no depende de las aplicaciones móviles que conocemos y amamos. Teniendo en cuenta que los servicios de voz tienen una curva de aprendizaje corta y pueden reducir significativamente las barreras para su adopción por parte de los usuarios, es razonable que la economía de la voz se desarrolle rápidamente una vez que notemos todo su potencial.

En el proceso de interacción con el software, el escenario que más tiempo lleva es el trabajo. Por tanto, es razonable suponer que veremos los cambios más notorios en los escenarios laborales. Si bien es posible que aún necesitemos interactuar con la pantalla, es probable que el teclado se vuelva redundante. Después de todo, una persona promedio puede escribir 40 palabras por minuto en un teclado, pero puede pronunciar 150 palabras.

La inteligencia artificial ubicua puede respaldar muchas tareas y procesos en nuestro trabajo diario, como responder correos electrónicos, organizar información de reuniones, publicar información para los miembros del equipo, actualizar sistemas relacionados con datos, etc. También podría significar que ya no estaremos encadenados a nuestros escritorios y tendremos que permanecer sentados durante largos períodos de tiempo.

Además, la inteligencia artificial ubicua puede detectar a los trabajadores más productivos y decirles a otros cómo trabajan, optimizando así el rendimiento laboral. Ha comenzado a surgir un ciclo de aprendizaje de IA que identifica continuamente las estrategias específicas de los de alto desempeño y distribuye consejos de alto desempeño a otros en la red. Estas redes de optimización no están diseñadas para reemplazar a los humanos, sino que dependen de ellos para aprender y optimizar los procesos. La humanidad seguirá al tanto.

Al hacer que las personas sean más inteligentes y eficientes, una nueva generación de productos SaaS podrá cobrar tarifas de suscripción más altas, convirtiéndose así en una generación más valiosa de software empresarial.

KOL virtual Lil Miquela

Como vemos, poco a poco va surgiendo el KOL virtual. Por ejemplo, Lil Miquela, una KOL virtual de 19 años de Los Ángeles, ha acumulado 15.000 fanáticos en Instagram y ha participado en actividades de marketing de conocidas marcas de moda como Calvin Klein.

El estudio creativo Fable, con sede en San Francisco, va un paso más allá con personajes virtuales.

Los personajes virtuales de la empresa tienen capacidades interactivas completas y personalidades propias. Pronto podremos crear compañeros holográficos con inteligencia artificial, como Joey de Blade Runner. El Joey fabricado por Wallace Company puede ser "todo lo que quieras ver".

Es probable que los avatares transformen el entretenimiento y el servicio al cliente, y también podrían desempeñar un papel clave en el servicio a las personas mayores y a otras personas necesitadas. Después de todo, las personas que se perciben como solitarias tienen un 59% más de probabilidades de tener mala salud, y el aislamiento social es una de las causas más comunes de depresión.

Safe365, con sede en Barcelona, ​​atrae a muchas personas mayores como una comunidad impulsada por la tecnología y una red de ayuda mutua. Los productos de voz ofrecen una forma muy fácil de usar de controlar la salud y el rendimiento cognitivo y proporcionar recordatorios sobre el ejercicio y la medicación.

De hecho, la voz y la inteligencia artificial podrían llegar a sustituir por completo a los médicos. K Health ha desarrollado una inteligencia artificial que combina la experiencia de miles de médicos para realizar diagnósticos precisos. Con la ayuda de la tecnología de voz, la IA también puede brindar comodidad a los pacientes, al igual que los médicos humanos.

Según nuestro análisis, la inversión en startups de voz se está acelerando. Las startups de tecnología de voz han recaudado 786 millones de dólares este año, superando con creces los 586.5438 millones de dólares de 2018 y los 298 millones de dólares de 2017. Este crecimiento del financiamiento muestra la confianza del mercado en que la tecnología de voz traerá cambios. La escala de financiación también ha aumentado significativamente. El tamaño promedio de las transacciones en lo que va de 2019 es de 30 millones de dólares, en comparación con 180.000 dólares en 2018 y 175.000 dólares en 2017.

Al mismo tiempo, el Amazon Alexa Fund ha realizado 72 inversiones desde su creación en 2015. En los últimos 18 meses, el fondo ha invertido en nuevas empresas de las industrias del entretenimiento, la salud, la educación, el transporte, el comercio electrónico, la hostelería y el SaaS. Esto demuestra que Amazon cree que la tecnología de voz transformará una variedad de industrias.

Uno de los mayores retos de la tecnología de voz es la protección de la privacidad. Según Microsoft, al 41% de los usuarios de asistentes de voz les preocupa la confianza, la privacidad y la vigilancia pasiva. El descubrimiento de un micrófono oculto en el dispositivo Nest de Google tuvo consecuencias negativas, al igual que la solicitud de patente de Amazon para "monitorear todas las conversaciones en una habitación".

Cómo responder a estas preocupaciones depende de las empresas tecnológicas, y Apple ha hecho un trabajo eficaz en este sentido. Apple merece crédito por adquirir Silk Labs, que desarrolla software de inteligencia artificial que se ejecuta en dispositivos en lugar de utilizar una plataforma de computación en la nube para procesar datos.

Apple ha tardado en construir un ecosistema en torno a los servicios de voz. De hecho, la "Herramienta de navegación del conocimiento" de Apple propuesta en 1987 dio una visión más clara de los servicios de voz. La comunidad de servicios de voz espera con ansias que Apple lance el sistema operativo Siri para la comunidad de desarrolladores en la Conferencia Mundial de Desarrolladores (WWDC) de 2020, acelerando así la innovación y la popularización.

Bret Schmidt, editor y editor de Voicebot.ai, dijo: "Siri OS es necesario para fomentar la innovación. Muchos creen que Apple necesita ponerse al día con Amazon y Google Voice en el progreso realizado por los asistentes".

Una de las preguntas que plantean películas populares como Automata es que si nos obsesionamos con los robots y nos enamoramos del código en lugar de otras cosas, entonces la inteligencia artificial se convertirá en una amenaza para la humanidad. Si bien esta afirmación puede parecer descabellada para algunos, los simuladores de citas han demostrado ser extremadamente populares. A nivel nacional, las descargas del juego "Love and Producer" superaron los 7 millones en el primer mes.

Si bien desafía nuestras nociones de privacidad y plantea nuevas preguntas sobre la relación de los humanos con la tecnología, hay muchas razones para permanecer optimistas sobre la tecnología de voz. Esta tecnología impulsará una nueva ola de mejoras de productividad que beneficiarán a los consumidores, las empresas y la sociedad. Además, nos ayudará a cuidar mejor de las personas mayores y al mismo tiempo hará que Internet sea accesible para los 774 millones de analfabetos del mundo.

La desaparición del teclado: Ya no necesitamos escribir, sino que podemos utilizar la voz y los gestos. Los teclados prácticamente se extinguirán en los próximos 5 a 10 años.

La tecnología de voz marcará el comienzo de nuevas categorías de productos, incluidos los teléfonos inteligentes sin pantalla.

Pronto será necesario identificar las marcas mediante la “identidad de voz” y la búsqueda de productos se revolucionará.

Dado que los usuarios no pueden centrarse en aplicaciones específicas cuando utilizan servicios de voz, el hardware volverá a ser más importante que el software.

Los compañeros virtuales se harán realidad y cubrirán todas las necesidades de tu vida.

Apple lanzará el sistema operativo Siri en 2020, promoviendo así una enorme innovación en la economía de la voz. Para 2025, la economía de la voz alcanzará el billón de dólares, superando la economía de las aplicaciones móviles.