Tecnología
Ciberpaís

La industria de la lengua se abre camino en los ordenadores

El análisis de la voz digital y la web semántica, dos áreas donde la investigación progresa

Instalaciones de Verbio.

En los años noventa empezaron a popularizarse programas que, con algo de paciencia, permitían dictar al ordenador un texto. Este tipo de soluciones necesitaban un tiempo de ensayo con su cliente para tomarle las medidas vocales. Ahora, en los teléfonos móviles hay asistentes virtuales, más o menos imperfectos, que empiezan a permitir el viejo sueño de hablarle a las máquinas. Pero la industria informática de la voz y el lenguaje hace años que trabaja.

El análisis digital de la voz abre el camino a muchas aplicaciones, por ejemplo, desde el control biométrico de un acceso a través de la huella vocal de la persona a la subtitulación de filmes, la ayuda en la atención de los call centers, aplicación en entornos de enseñanza digital para mejorar la curva aprendizaje … Una empresa española que trabaja en este terreno es Verbio. Sus sistemas de análisis de la locución permiten no solo saber qué dice una persona si no, también, como lo dice, si está enfadada, alegre…Antonio Terradas, uno de sus actuales propietarios, subraya que la tecnología del habla tiene mala fama porque su aplicación en sistemas poco desarrollados y deficientes hace que algo que ha de facilitar la vida…la complique. Esta tecnología, explica, trabaja con modelos acústicos y de lenguaje. Los primeros analizan la emisión del fonema, la entonación, a través de qué medio se habla (micrófono, teléfono). Los modelos lingüísticos, basados en estadísticas, calculan la posibilidad, por ejemplo, de que una palabra vaya precedida habitualmente por otra, variantes dialectales….

Verbio, fundada en 1999 por catedráticos de la UPC, ha ido investigando en este terreno. La gran dificultad es que una vez llegas a un determinado porcentaje de fiabilidad, mejorarlo resulta muy difícil. “Y superar estos umbrales es imprescindible en muchas aplicaciones que no son meramente lúdicas. La subtitulación automática en un vídeo de YouTube es buena, con un 80% de acierto. El internauta ya está satisfecho. Pero este 80% es insuficiente cuando esta técnica se usa en la administración. El nivel de acierto que se exige supera el 95%”. La voz de cada persona es única y puede servir para emitir la fe de vida de millones de ciudadanos de una comunidad. De ahí la escasa tolerancia al fallo.

Los programas Verbio de síntesis de voz y reconocimiento del habla se emplean en servicios y centros de atención al cliente de muchas compañías, en automatización de procesos industriales o logísticos, en entornos domóticos o en productos de ayuda a la discapacidad. Algunos clientes las emplean para analizar las llamadas telefónicas que han tenido éxito comercial y las que no para ajustar sus mensajes y conductas mercantiles. Con sede central en España ahora su objetivo son los países latinoamericanos -abriendo oficinas en Brasil, Argentina, Chile y Colombia- incluyendo nuevos acentos e idiomas.

Otro tipo de empresas se centran no ya en la voz sino en la semántica y la inteligencia artificial, otro concepto anticipadamente muy explotado y que el ciudadano esperaba que llegara de manera más rápida. Isoco, por ejemplo ,investiga en la web semántica, un concepto cuyo enunciado parece nebuloso si no se ven los resultados. En eso trabaja Isoco. “La web semántica es aquella en la que se estandariza la forma de codificar la información, etiquetándola, de manera que se facilite su acceso e interpretación por parte de máquinas. En la web se generan enormes cantidades de contenidos y el reto es que las máquinas sepan ordenarlos, extraerlos y analizarlos para generar conocimiento ”, comentan Sergi Mesquida y Elena Castells, de la citada compañía.

Isoco ofrece, un caso, su propio asistente virtual, Sherpa, para la atención al usuario final a través de la web de la compañía cliente. “El usuario hace preguntas en un lenguaje natural y Sherpa debe responder de igual forma, guiando y ayudando al usuario a encontrar lo que necesita. El sistema ha de interactuar de forma empática como un dependiente amable”. Naveganza es un buscador interno para empresas que interpreta el lenguaje natural, aplica criterios de conocimiento (semántica) y no solamente sintácticos lo que aumenta su fiabilidad y la extracción del conocimiento que alberga la corporación, a veces diseminado, perdido

Isoco participa en varios programas de investigación internacionales promovidos por la Unión europea o el consorcio W3C para empujar la evolución de la web hacia un espacio inteligente capaz de realizar tareas y no únicamente almacenar datos. Con la universidad de Cambridge y Yahoo trabajan en el proyecto Parlance que permitirá una interacción amigable entre el usuario y su teléfono móvil a través del reconocimiento de la voz.

 

Para poder comentar debes estar registrado en Eskup y haber iniciado sesión

Darse de alta ¿Por qué darse de alta?

Otras noticias

Últimas noticias

Ver todo el día

La Diputación distingue al Museo Guggenheim

EP

La Federación de Fútbol y la Orquesta de Acordeones también recibirán el título honorífico

800 estudiantes desentrañan la ciudad con sus móviles

Alumnado de una 16 de institutos recorre Valencia resolviendo enigmas y retos de geolocalización

Barberá se burla desde el balcón de las protestas de la Intifalla

La alcaldesa de Valencia desaira al colectivo que protesta en las fiestas falleras bajo el balcón del Ayuntamiento

EL PAÍS RECOMIENDA

LA CUARTA PÁGINA

Por qué nos fuimos del CSIC (y por qué volveríamos)

Tres exinvestigadores de la institución denuncian que es incapaz de adaptarse

China quiere las tripas y los despojos del cerdo español

Ana Carbajosa Cártama

Las empresas de porcino despuntan con la venta de estómago o intestinos

Lo más visto en...

» Top 50


Webs de PRISA

cerrar ventana