Más que palabras

Juan José Moreira | Gradiant | 2 de Mayo de 2014

El reconocimiento de voz es una disciplina que busca permitir a un dispositivo reconocer y entender palabras habladas. Hasta hace poco tiempo, la idea de mantener una conversación con un ordenador  parecía algo reservado exclusivamente al terreno de las películas de ciencia-ficción, sin embargo, las cosas están cambiando. Desde aquel primer sistema de los Laboratorios Bell llamado Audrey desarrollado hace más de 60 años y que solamente era capaz de reconocer dígitos, la tecnología de reconocimiento de voz ha ido evolucionando y hoy en día el número de gente que “habla” con su móvil para marcar un número de teléfono, enviar un SMS, establecer una alarma o realizar una búsqueda en internet es cada vez mayor.
Pero el reconocimiento de voz se está abriendo también  a otros campos de aplicación. Los nuevos modelos de televisión de Samsung permiten controlar muchas de sus funcionalidades a través de la voz. Desde las más clásicas, como subir o bajar el volumen o cambiar de canal, a las más avanzadas, como solicitar a la televisión que nos recomiende algún programa o que nos liste todas las películas determinado género que se están emitiendo en ese momento.
Dentro del mundo del automóvil, también son muchas las marcas que empiezan a incorporar este tipo de tecnología a sus vehículos. Así, por ejemplo, tenemos a Ford con su sistema Sync o a Opel con su Intellilink. Este tipo de sistemas se utilizan para controlar con la voz ciertos sistemas del coche como por ejemplo el climatizador, el manos libres para realizar llamadas o el navegador GPS.
El reconocimiento de voz también se está extendiendo dentro del ámbito de las herramientas de gestión de “call-centers” donde se utilizan para guiar al cliente a través de las distintas opciones, para monitorizar el servicio ofrecido por los agentes o incluso para medir el grado de satisfacción del cliente.
Estos son sólo unos pocos ejemplos de cómo los sistemas de reconocimiento de voz se están mostrando como una tecnología emergente con una capacidad cada vez mayor de penetrar en distintos sectores del mercado.  Pero de la voz se puede extraer algo más que palabras y llegar a conocer, por ejemplo, el estado anímico del locutor. Así, existen diversos proyectos de investigación en los que se trata de desarrollar un agente virtual capaz de interactuar de manera natural con un humano gracias a la combinación de reconocimiento de voz y reconocimiento de emociones.

 

En GRADIANT apostamos por estas tecnologías y en la actualidad estamos inmersos en el desarrollo de nuestras propias soluciones de reconocimiento de voz y reconocimiento de emociones en la voz dentro del marco de distintos proyectos.