El gigante chino de búsqueda Baidu derrotó fácilmente a dos gigantes tecnológicos estadounidenses, Microsoft y Google, en una competencia de procesamiento del lenguaje natural de los principales modelos de inteligencia artificial del mundo.
La Evaluación General de Comprensión del Lenguaje (GLUE) es el estándar utilizado para entrenar, evaluar y analizar sistemas de comprensión del lenguaje natural basados en IA. Las organizaciones que están desarrollando modelos de procesamiento del lenguaje natural basados en inteligencia artificial pueden evaluar sus modelos utilizando la escala de referencia GLUE.
Hasta hace poco, el modelo MT-DNN-SMART de Microsoft seguía liderando la clasificación mundial de GLUE, seguido por el modelo T3 de Google. Sin embargo, esta clasificación acaba de sufrir una gran perturbación porque en la reciente competencia de procesamiento del lenguaje natural, el modelo ERNIE (Representación mejorada a través de la integración del conocimiento) de Baidu derrotó tanto a MT-DNN-SMART como a T3 con una puntuación récord de 90,1.

Inicialmente, el modelo de Baidu se desarrolló para comprender el idioma chino, pero los investigadores pronto se dieron cuenta de la excelente promesa del modelo para comprender el inglés. El método de capacitación ERNIE de Baidu está fuertemente inspirado en la "antigua" herramienta de capacitación del modelo de procesamiento de lenguaje de Google llamada BERT. En consecuencia, el 15% de las palabras en cada cadena de oraciones se ocultarán en cada sesión de entrenamiento; la tarea de IA intenta predecir las palabras ocultas lo más fielmente posible en función del contexto. El equipo de investigación de Baidu ilustró esta técnica en su página de Github con ejemplos citados de la serie de novelas de Harry Potter. Como resultado, ERNIE pudo extrapolar la relación entre Harry Potter y JK Rowling analizando el conocimiento tácito de palabras y entidades, para concluir que Harry Potter es una serie de novelas escritas por JK Rowling.
"Si bien la comprensión del lenguaje sigue siendo un desafío enorme, nuestros resultados para el proyecto ERNIE han demostrado que los modelos de procesamiento del lenguaje multitarea y continuamente entrenados son el camino a seguir prometedor para la investigación de la PNL", comentó el equipo de investigación de Baidu.
Actualmente, Baidu está promoviendo la aplicación del modelo ERNIE para tareas prácticas. Por ejemplo: actualmente, Baidu utiliza el modelo ERNIE para la función de respuesta automática a preguntas en su motor de búsqueda, lo que da como resultado una mejora del 16 % en la satisfacción del usuario con los resultados de búsqueda.