sábado, 6 de julio de 2013

El reconocimiento de voz: el presente de las tecnologías

Nadie puede negar el hecho de que estamos rodeados por todas partes de dispositivos tecnológicos, un entorno inteligente cada vez más amplio que hace apenas unos años poca gente era capaz de imaginar. Posiblemente, cuando comenzaron a utilizarse los primeros computadores fuera de los entornos universitarios o, incluso, cuando comenzaron a utilizarse los primeros dispositivos móviles, nadie imaginó la explosión tecnológica que vivimos hoy en día y el cambio de paradigmas organizativos o legales que ha supuesto la integración de la tecnología en nuestras vidas.

Coches, smartphones, tabletas y ordenadores son algunos ejemplos de objetos que podemos gobernar mediante comandos de voz, es decir, mediante órdenes dictadas con nuestra propia voz. Los interfaces vocales han mejorado mucho y poco o nada tienen que ver con algunas aplicaciones de dictado que se comercializaban a finales de los años 90 y que supusieron un antes y un después en nuestra forma de trabajar (aunque la calibración de este tipo de aplicaciones pudiese desesperar al más paciente). Si bien fue en los años 90 cuando comenzaron a popularizarse este tipo de interfaces de entrada y en nuestros días hemos asistido a una explosión total (gracias a la mejora de la tecnología), el concepto es mucho más antiguo de lo que, quizás, podríamos imaginar y, desde luego, supuso un gran reto para los ingenieros de la época.

Una de las primeras implementaciones documentadas que podemos ver “funcionando en vivo” ha sido recogida por el Computer History Museum en su canal de YouTube (que vale la pena visitar para conocer mucho mejor la evolución de la tecnología que nos rodea) y nos sitúa en los primeros trabajos en este campo que se realizaron en el Laboratorio de Inteligencia Artificial de la Universidad de Stanford en el otoño de 1968.

Por aquel entonces, el equipo de Stanford presentó en un pequeño documental los avances que habían conseguido en el campo del reconocimiento de voz, unos resultados que se habían materializado en una computadora capaz de “aprender a reconocer frases” y la posibilidad de controlar, mediante órdenes de voz, un sistema que controlaba un brazo-robótico.


Aunque pueda recordar a las “películas de iniciación” de la inciativa DARPA de la serie Lost, estamos ante un documento histórico que vale la pena revisar y, sobre todo, recordar cuando usamos la marcación por voz de nuestro teléfono móvil o le dictamos un SMS y mirar con perspectiva histórica como han cambiado las cosas y, a su vez, cómo permanece invariante el concepto original.


2 comentarios:

Antonio Lázaro dijo...

Los avances en el reconocimiento de voz y el registro de órdenes se han hecho cada vez más populares llegando incluso al ocio diario.
Las últimas implementaciones de este sistema permitirán en los nuevos dispositivos de entretenimiento virtual abrir y ejecutar comandos con nuestra voz rozando en determinados momentos la intromisión en la intimidad de nuestro día a día ya que su utilización está ligada a los sistemas en nube.
La existencia de micrófonos ambientales que recojan nuestras órdenes “in situ” puede provocar en ciertos aspectos que tanto las ordenes como nuestras conversaciones personales queden grabadas y expuestas en la red, un sistema a día de hoy con muchas brechas y donde como única garantía se avala la política de privacidad de las firmas que lo ofertan.
Será el tiempo y la interacción con estas tecnologías la que determine su éxito y enmarquen su uso, cada día más cercano.

David Domínguez dijo...

Estoy de acuerdo en cuanto al dilema moral intimidad vs información aunque como siempre que proporcionamos datos (sea por voz o no) probablemente estaremos renunciado a una parte de nuestra intimidad por una mejora de nuestra calidad de vida. Otra aplicación del reconocimiento de voz puede ser el de dispositivos electrónicos que sean usados por nuestros mayores mejorando esa calidad de vida que mencionaba antes. Un saludo