La evolución del reconocimiento de voz lleva el hogar inteligente al siguiente nivel

Las tecnologías de reconocimiento de voz avanzan en dispositivos IoT, prometiendo transformar el hogar conectado. Desde sus inicios en los años 50, el reconocimiento de voz ha evolucionado, llegando a una precisión notable en 2018 y acelerando debido a la pandemia. Se espera que para 2023 haya 8 mil millones de asistentes de voz digitales en uso, impulsando un mercado de $31.82 mil millones para 2025. Estos sistemas permiten una automatización del hogar inteligente más allá de la gestión de dispositivos, incorporando interacción basada en emociones y contexto, y abriendo posibilidades para nuevos usos.

Las tecnologías de reconocimiento de voz maduran y se meten en una nueva generación de dispositivos IoT que prometen revolucionar aún más el hogar conectado.

Los primeros sistemas de reconocimiento de voz, desarrollados a principios de la década de 1950, sólo tenían la posibilidad de interpretar números.  Recién varias décadas después, para 2018, el nivel de precisión de reconocimiento de voz humana se perfeccionó, expandiéndose a variedad de industrias y dispositivos conectados. 

De hecho, la pandemia hizo más necesario repensar la forma en que los usuarios interactúan con los dispositivos, a favor de los sistemas sin contacto. Además de mencionar que la experiencia del cliente gana en comodidad al agregar comandos verbales.

Las estimaciones señalan que habrá 8 mil millones de asistentes de voz digitales en uso para 2023, frente a los 2,5 mil millones estimados para fines de 2018; un mercado que por otra parte se prevé que alcance los $ 31.82 mil millones para 2025.

Industrias de todo tipo están combinando capacidades de IoT con tecnología de reconocimiento de voz para satisfacer las cambiantes demandas de los usuarios, las mejores en los procesos y brindar valor agregado. 

El hogar conectado es uno de los ámbitos que más está sacando provecho de las tecnologías de voz. Un ecosistema de hogar inteligente interconectado permite el acceso remoto y el monitoreo en tiempo real de los dispositivos, sin embargo, los sistemas de control habilitados por voz están llevando la automatización del hogar inteligente al siguiente nivel. Los centros de hogares inteligentes como Amazon Echo, Google Nest y Samsung SmartThings permiten a los usuarios usar comandos de voz simples para administrar los dispositivos conectados – de luces a electrodomésticos, climatización, puertas, duchas, entre muchos otros- todo desde una única interfaz.

Los asistentes de voz son cada vez más inteligentes gracias a una combinación de distintos avances tecnológicos: por un lado, la evolución del procesamiento del lenguaje natural que permite el análisis de sentimientos y la comprensión del contexto general; por otro, mejoras en inteligencia artificial y aprendizaje automático que impulsan experiencias personalizadas y finalmente, el aumento de la ubicuidad de los dispositivos IoT controlados por voz.

Cuando los algoritmos de los dispositivos responden a los requerimientos, aprenden al mismo tiempo. Cuanto más interactúa una persona con los dispositivos activados por voz, más tendencias y patrones identifica el sistema en función de la información que recibe. Luego, estos datos se pueden utilizar para determinar las preferencias y los gustos de los usuarios, lo cual es un punto de venta a largo plazo para hacer que un hogar sea más inteligente.

Estos dispositivos con comandos de voz están evolucionando rápidamente, por ejemplo, para percibir más que preferencias y gustos. Google y Amazon buscan integrar inteligencia artificial habilitada por voz capaz de analizar y responder a las emociones humanas. Si bien aún no está claro el alcance total de cómo se verá esto, la base de este proyecto radica en que los dispositivos puedan identificar y adaptarse a las motivaciones y preocupaciones de un usuario, muy similar a la revolucionaria interacción que tiene el personaje principal de la película “Her” con OS1, un sistema operativo diseñado para adaptarse y evolucionar como un ser humano, que realiza todas las comunicaciones a través de comandos de voz y pronto pasa de ser solo un asistente de voz a un interés amoroso del protagonista.

La segunda generación de sistemas de reconocimiento acústico para dispositivos inteligentes podrá distinguir el contexto que escucha. Eventualmente, los dispositivos de IoT activarán la alarma cuando escuchen el sonido del vidrio de una ventana rota o despertarán a los padres después de haber escuchado el llanto de un bebé o niño por la noche, abriendo un enorme potencial de mercado para nuevos usos y aplicaciones. Por lo tanto, la estrategia de captación de nuevos tipos de datos combinada con mayores niveles de machine learning serán claves. 

Por Julio Cesar Blanco – 3 de abril del 2023

Formá parte del mundo Cloud

Suscribite a nuestro resumen periódico de Noticias de Tecnología.

es_ES