El sistema de inteligencia artificial de Amazon ayuda a reducir los errores de reconocimiento de voz en Alexa en un 15%.

Hace unos meses, Amazon detalló una serie de problemas que impedían que Alexa brindara respuestas precisas cuando los usuarios activaban el asistente virtual en ciertos modelos de TV, en anuncios de Internet o de radio. Después de todo, el problema principal aquí es cómo el asistente de voz de Amazon puede filtrar eficazmente el ruido de fondo del entorno para proporcionar comentarios más precisos a los usuarios. Recientemente, en una publicación de blog y un artículo de investigación adjunto llamado Reconocimiento de voz anclado de extremo a extremo, los ingenieros de Amazon presentaron específicamente una nueva técnica de aislamiento de ruido basada en inteligencia artificial creada que puede ayudar a mejorar el reconocimiento de voz y los comandos de Alexa en un 15%. Se espera que se presente información más detallada sobre cómo funciona el sistema en la Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales que se celebrará en Brighton a finales de este año.

El modelo de IA de Disney genera secuencias animadas a partir de guiones

“De hecho, siempre intentamos mejorar el rendimiento de Alexa enseñándole a "ignorar" comandos que no están destinados a ella, es decir, a saber seleccionar comandos entre innumerables ruidos que emanan del entorno. Para hacerlo, asumimos que el hablante activa un dispositivo habilitado para Alexa diciendo alguna palabra de activación específica -generalmente “Alexa”- y esta es la frase clave que el asistente virtual debe aislar e identificar en un caos de sonidos del exterior. ambiente. Básicamente, nuestra técnica ayudará a "capturar" rápidamente sonidos que pueden ser palabras de activación (generalmente basadas en similitudes en entonación o fonemas) y compararlos con palabras de activación estándar para identificar oraciones con precisión. Entonces, Alexa entenderá la frase cuyos elementos se acerquen más a la palabra de activación estándar como una orden, mientras que las otras frases se considerarán ruido de fondo", afirmó Xin Fan, líder del equipo de científicos a cargo del proyecto Alexa. La IA explica.

La inteligencia artificial OpenAI derrotó al actual campeón mundial de Dota 2

En lugar de entrenar un sistema de inteligencia artificial separado para distinguir entre el ruido de fondo y las palabras de activación, Xin Fan y sus colegas fusionaron su mecanismo de coincidencia de palabras con un modelo de reconocimiento de voz basado en inteligencia artificial estándar. Los científicos probaron dos variaciones de la arquitectura de IA del decodificador en secuencia, es decir, utilizando una arquitectura que procesa los datos de entrada (instantáneas de la señal de audio de milisegundos de duración) para producir una secuencia de salida correspondiente (representación fonémica del sonido), y , como ocurre con la mayoría de las técnicas de codificador-decodificación convencionales, el componente de codificación resume los datos de entrada como un vector de longitud fija (una cadena de números) y los convierte en datos de salida. Mientras tanto, un mecanismo de atención especial, "entrenado" para detectar algunas características básicas de las palabras de activación en una o más cadenas de voz del entorno circundante, será responsable de "guiar" el conjunto. La decodificación presta más atención a esas características en el vector.

El sistema de inteligencia artificial de Amazon ayuda a reducir los errores de reconocimiento de voz en Alexa en un 15%.

UE: Los sistemas de IA deben construirse e implementarse de manera transparente y responsable

En un experimento, los investigadores entrenaron uno de sus modelos de inteligencia artificial para poner mayor énfasis en el reconocimiento de la pronunciación de palabras, primero agregando un componente que comparaba directamente los sonidos de las palabras con varias pronunciaciones y luego usa estos datos resultantes como entrada para otro separado. componente que ha sido entrenado para comprimir los bits del vector de codificación. Los resultados fueron interesantes, este modelo redujo la tasa de error al 13% en comparación con el 15%.

Tags: #Artificial Intelligence (AI)

Los restaurantes de sushi japoneses utilizan IA para evaluar la calidad de cada trozo de atún con gran precisión

Una cadena de restaurantes de sushi japonesa llamada Dentsu Inc acaba de desarrollar con éxito una aplicación llamada Tuna Scope, que utiliza IA para evaluar la calidad del atún con un alto nivel de precisión, no inferior al de los chefs más experimentados.

Una mirada a los precios de Slack: un breve recorrido por los planes de Slacks

Slack ha adoptado el modelo de negocio SaaS y ofrece varios planes diferentes para satisfacer las necesidades de su organización. He aquí un breve recorrido por las opciones.

¿Qué es Claude Pro? ¿Cómo se compara Claude Pro con ChatGPT Plus?

Descubre Claude Pro, la versión premium de Claude AI Chatbot, y cómo se compara con ChatGPT Plus, optimizando tu experiencia en inteligencia artificial.

Europa establecerá el grupo de trabajo ChatGPT

El organismo que une a los organismos nacionales de vigilancia de la privacidad de Europa dijo el jueves que había creado un grupo de trabajo dedicado a ChatGPT.

La IA predice la hora de la muerte humana con un 78% de precisión

Científicos daneses y estadounidenses han colaborado para desarrollar un sistema de inteligencia artificial llamado life2vec, capaz de predecir el momento de la muerte humana con gran precisión.

La IA predice enfermedades urinarias sólo por el sonido de la orina

Un algoritmo de inteligencia artificial llamado Audioflow puede escuchar el sonido de la micción para identificar de manera efectiva y exitosa los flujos anormales y los correspondientes problemas de salud del paciente.

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

El envejecimiento y la disminución de la población de Japón han dejado al país sin un número significativo de trabajadores jóvenes, especialmente en el sector de servicios.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Un usuario de Reddit llamado u/LegalBeagle1966 es uno de los muchos usuarios enamorados de Claudia, una chica con apariencia de estrella de cine que a menudo comparte seductores selfies, incluso desnudos, en esta plataforma.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

Microsoft acaba de anunciar que 12 empresas tecnológicas más participarán en su programa AI for Good.

La IA recrea personajes de Dragon Ball en carne y hueso

El usuario @mortecouille92 ha puesto a trabajar el poder de la herramienta de diseño gráfico Midjourney y ha creado versiones excepcionalmente realistas de personajes famosos de Dragon Ball como Goku, Vegeta, Bulma y el anciano Kame. .

El sistema de inteligencia artificial de Amazon ayuda a reducir los errores de reconocimiento de voz en Alexa en un 15%.

Leave a Comment

Los restaurantes de sushi japoneses utilizan IA para evaluar la calidad de cada trozo de atún con gran precisión

Una mirada a los precios de Slack: un breve recorrido por los planes de Slacks

¿Qué es Claude Pro? ¿Cómo se compara Claude Pro con ChatGPT Plus?

Europa establecerá el grupo de trabajo ChatGPT

La IA predice la hora de la muerte humana con un 78% de precisión

La IA predice enfermedades urinarias sólo por el sonido de la orina

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

La IA recrea personajes de Dragon Ball en carne y hueso