La Inteligencia Artificial Ha Aprendido A Reconocer Correctamente El Habla Entre Ruido - Vista Alternativa

La Inteligencia Artificial Ha Aprendido A Reconocer Correctamente El Habla Entre Ruido - Vista Alternativa
La Inteligencia Artificial Ha Aprendido A Reconocer Correctamente El Habla Entre Ruido - Vista Alternativa

Vídeo: La Inteligencia Artificial Ha Aprendido A Reconocer Correctamente El Habla Entre Ruido - Vista Alternativa

Vídeo: La Inteligencia Artificial Ha Aprendido A Reconocer Correctamente El Habla Entre Ruido - Vista Alternativa
Vídeo: Webinar UC: "Inteligencia Artificial una revolución a plena marcha" 2024, Mayo
Anonim

Los asistentes virtuales y los sistemas de reconocimiento de voz han aprendido a "reconocer" lo que una persona les dice y a seguir sus órdenes. Pero para el correcto funcionamiento del mismo Siri y Cortana, el ruido extraño puede ser un gran problema. Los expertos de Mitsubishi Electric pueden ayudar a hacer frente a esta falla técnica, quienes presentaron una nueva tecnología para separar el habla de una persona del ruido general.

La tecnología de la empresa japonesa se llama Deep Clustering, cuyo funcionamiento se basa en los principios del aprendizaje automático. Para empezar, la inteligencia artificial aprendió a separar de forma independiente el habla de una persona del flujo general de varios sonidos y ruidos. La red neuronal separa los datos de audio entrantes en varios elementos y analiza cada uno por separado, después de lo cual ya puede procesar la voz humana. Se observa un trabajo similar cuando dos o más interlocutores están "conectados".

Durante una demostración de la tecnología de una empresa japonesa, el sistema pudo separar con éxito el discurso de dos personas que hablaban la misma oración en diferentes idiomas en un micrófono. Todo el procesamiento se realizó en tiempo real y el retraso no superó los tres segundos. La precisión del reconocimiento fue del 90 por ciento, y cuando tres personas comenzaron a hablar por el micrófono, el porcentaje de "aciertos" se redujo a 80, lo que también es un buen resultado. Según los autores del proyecto Anthony Vetro y Yohei Okato,

“A diferencia de separar el habla de los ruidos de fondo, separar el habla de una persona del ruido de la“voz”de las personas que hablan al mismo tiempo es una tarea muy difícil, ya que los sonidos de las voces de diferentes personas tienen muchas peculiaridades. En la mayoría de los sistemas, el problema de la separación de voces se resuelve instalando dos o más micrófonos, pero en el caso de utilizar un solo micrófono, solo la inteligencia artificial puede hacer frente a la tarea de separación de voces. Esta tecnología se puede utilizar siempre que se requiera una alta precisión en el reconocimiento de mensajes de voz. Por ejemplo, en sistemas de control por voz para automóviles, ascensores, dispositivos domésticos y otros dispositivos electrónicos.

norte

VLADIMIR KUZNETSOV

Recomendado: