Microsoft acaba de anunciar una nueva mejora en el sistema de reconocimiento de voz de Windows Phone vía Bing. En reciente post del blog de Bing se comentó que las características de voz a texto de Bing eran dos veces más rápidas y un 15% más exactas gracias al uso de inteligencia artificial basada en la biología.
En el vídeo que abre este artículo se puede ver la demostración y cómo tanto en situaciones normales como también en situaciones con ruido el nuevo motor de reconocimiento en Windows Phone se comporta mucho mejor, ofreciendo resultados correctos y de una manera mucho más rápida que su predecesor.
Para ello no se han utilizado millones de muestras de voces con ruido que se intentan comparar en tiempo real sino que se ha enseñado a la máquina a entender la voz humana en cualquier situación. Para ello hacen uso de lo que se conoce como deep neural networks (DNN). Los científicos han hecho uso de cómo es el patrón de reconocimiento de nuestro cerebro y lo han utilizado como inspiración para implementar un sistema capaz de discernir qué se dice en cualquier situación.
Obviamente hace falta mucho más que eso, detrás de todo el sistema hay innumerables funciones matemáticas, superordenadores y muchas muestras de sonido hasta que se ha dado con el patrón exacto, pero la realidad final es, como se puede ver en el vídeo, un resultado impresionante.
Más información | Windows Phone Blog y TechNet
Ver 7 comentarios
7 comentarios
danielcrm5
¿Alguna fecha de cuando llegara a nuestros terminales?
emyzz
Ya se vio una muestra de las mejoras del reconocimiento de voz en un video en YouTube, y aparentemente mejoraba bastante, al igual que iban a añadir que conforme hablabas iba ya poniendo las palabras, y no esperar a que termines para reconocer que has dicho.
apolo2202
Esperemos que llegue pronto a nuestros telefonos
flick00
Esta actualizacion ya esta disponible para todos los terminales windows phone, segun el blog de Bing.
La actualizacion afecta a los servidoes de Bing no a los terminales. Yo ya lo he provado y si se nota le difernecia en velocidad.
Saludos
sarubabcn
La gracia completa, será cuando podamos activar el reconocimiento de voz sin tener que tocar nada...
Y por supuesto con opción de ponerle la voz de Kit (para la generación de los 80) ;)