sábado, 23 de agosto de 2014

Traductor en tiempo real de Skype: Microsoft usa las redes sociales para crearlo

a os hemos comentado en varias ocasiones el proyecto que Microsoft tiene entre manos: Permitir que Skype traduzca conversaciones en tiempo real. La idea es fantástica, las posibilidades son enormes… se acabarían las barreras a la hora de hacer videoconferencias con otras personas de otros países en Skype, de hecho sería el primer paso para crear un sistema eficaz de traducción simultánea automático… parece ciencia ficción. 


Ahora informan más detalles sobre cómo funciona ese sistema, y las redes sociales, como no, están presentes.
Los textos que publicamos en las redes sociales son usados por esta nueva plataforma de traducción para entender cómo se comunican los seres humanos, para usar el lenguaje del día a día, para ser lo más naturales posibles.

El sistema es una síntesis de varias tecnologías, incluyendo el reconocimiento de voz, traducción automática, y la síntesis de voz, programa que veremos en versión beta antes de terminar el año. Ahora se están concentrando en crear un sistema natural de conversación, ya que hablamos de una forma diferente a como escribimos (hay varios ahh, ehhh, mmm, que deben ser también reconocidos). Para ello trabaja también con estadística, almacenando frases que se suelen decir después de otras, personalizadas para ciertos grupos de personas, deduciendo cuando llegará una pregunta o una exclamación después de cierta frase en determinados contextos… y las redes sociales ayudan bastante a enseñar a las máquinas a “hablar” de esta forma.

Para cada red social se tuvieron en cuenta diferentes factores, ya que en Facebook suelen aparecer expresiones más emocionales, en la red SMS son mensajes demasiado cortos y Twitter es una mezcla extraña entre ambas realidades. Los investigadores tuvieron que desarrollar en primer lugar un sistema de normalización de textos en comunicación social, un software que podría adaptarse automáticamente a estas variaciones para producir algo que el software pudiera procesar.

Los detalles sobre cómo se ha realizado este estudio los podéis encontrar en spectrum.ieee.org, donde informan el nombre de esta tecnología: Syntactic SMT (Statistical Machine Translation). En el mismo artículo hablan de los esfuerzos de Google en el mundo de la traducción, aunque de momento no están trabajando en nada semejante a Skype traduciendo en tiempo real.
Ansiosos estamos para ver el sistema funcionando…


Original

0 comentarios:

Publicar un comentario