Cómo Funciona La Inteligencia Artificial: Reconocimiento De Voz - Vista Alternativa

Tabla de contenido:

Cómo Funciona La Inteligencia Artificial: Reconocimiento De Voz - Vista Alternativa
Cómo Funciona La Inteligencia Artificial: Reconocimiento De Voz - Vista Alternativa

Vídeo: Cómo Funciona La Inteligencia Artificial: Reconocimiento De Voz - Vista Alternativa

Vídeo: Cómo Funciona La Inteligencia Artificial: Reconocimiento De Voz - Vista Alternativa
Vídeo: ¿CÓMO FUNCIONAN LOS DISPOSITIVOS CONTROLADOS POR VOZ? 2024, Septiembre
Anonim

Cada uno de nosotros se enfrenta a un fenómeno tan misterioso como la inteligencia artificial en la vida cotidiana: es él quien permite que los asistentes de voz y los motores de búsqueda reconozcan el habla humana y adivinen los deseos de los usuarios. Hoy hablaremos de cómo se organiza exactamente esta tecnología y qué perspectivas aguardan a esta área de desarrollo en un futuro próximo.

La inteligencia artificial es un término muy amplio, en el marco del cual ya existen muchos algoritmos y aún están en desarrollo, diseñados para realizar una amplia gama de tareas prácticas. Pero, ¿de qué son realmente capaces los programas modernos de inteligencia artificial y qué principios los guían durante su trabajo? Hoy hablaremos sobre una de las características clave de la mente de la máquina, que cada uno de nosotros encuentra regularmente en la vida cotidiana: la capacidad de los asistentes de voz para reconocer el habla humana.

Reconocimiento de voz

norte

Para medir la voz, el programa utiliza una serie de parámetros de sonido: la frecuencia y la longitud de la onda de sonido en un momento determinado. Por ejemplo, cuando habla con la popular asistente de voz Alexa, el software divide su voz en diapositivas de 25 milisegundos y luego convierte cada uno de los segmentos en firmas digitales. Después de eso, los bloques de firmas se comparan con el catálogo interno de sonidos del programa hasta que el número de coincidencias es lo suficientemente alto para que la IA "traduzca" los números en una consulta alfabética que entienda.

Image
Image

Mire la pantalla de su teléfono mientras usa Siri o Google Assistant y verá que el vocabulario cambia a medida que dice las palabras. Esto se debe al hecho de que con cada siguiente "paso" el software también compara el resultado obtenido con la base de datos interna y construye palabras en función de las coincidencias. Según Rohit Prasad, científico jefe de la división Alexa de Amazon, "el modelo de lenguaje aprende muchos miles de millones de palabras en forma de texto". El orden de las palabras también juega un papel importante: esto también se puede notar con la ayuda del motor de búsqueda habitual de Google, que a veces proporciona datos diferentes para consultas idénticas, en las que solo se han reordenado un par de palabras.

Video promocional:

Perspectivas del reconocimiento de voz

Alan Black del Carnegie Institute for Language Technology sostiene que para todos los profesionales de las grandes empresas, lo más interesante es encontrar el límite de su propio sistema. “Cuando el programa dice 'No puedo hacer esto', la situación se pone realmente interesante”, bromea. Sin embargo, este es de hecho el caso: responder a solicitudes impredecibles de los usuarios es incluso una de las principales tareas que los círculos de estudiantes que compiten por el Premio Alexa, y esto equivale a $ 2.5 millones, están investigando. Su tarea es crear un chatbot diseñado para comunicarse con personas que hacen preguntas coherentes y significativas. La información en este caso se actualiza cada 20 minutos. Parece una tarea bastante fácil incluso para un programador promedio,pero en la práctica, la comunicación del programa con personas reales siempre está asociada con desviaciones del tema del diálogo, frases espontáneas y otras violaciones. Un programa que aprenda a trabajar con ellos, así como con una persona real, será un gran avance para toda la industria de la IA.

Vasily Makarov

Recomendado: