Los sistemas de aprendizaje profundo funcionan seleccionando patrones estadísticos en los datos; así es como interpretan su propia visión del mundo. Sin embargo, este método de aprendizaje estadístico requiere una gran cantidad de datos de entrada y no es particularmente útil para ayudar a los sistemas de aprendizaje profundo a aplicar conocimientos del pasado a situaciones nuevas, a diferencia de la IA simbólica, que permite registrar la secuencia de pasos dados para tomar una decisión. tomar decisiones con menos datos que los métodos tradicionales.

Un nuevo estudio realizado por un equipo de científicos de inteligencia artificial del MIT, MIT-IBM Watson AI Lab y DeepMind muestra el potencial del entrenamiento de IA cuando se aplica a una tarea simbólica específica, por ejemplo, captar el significado de imágenes. En consecuencia, en los experimentos, los modelos de IA de los científicos adquirieron conceptos relacionados con objetos como el color y la forma, luego usaron ese conocimiento para crear relaciones entre muchos objetos en una escena, mientras requerían solo datos de entrenamiento mínimos y no tenían que ser programados explícitamente.
“Todos sabemos que utilizar una combinación de palabras e ilustraciones es una forma eficaz de ayudar a los niños a aprender y recordar un concepto específico. Nuestra idea de este modelo simbólico de IA es la misma. Gracias a esto, el sistema necesitará menos datos de entrenamiento y podrá transferir mejor el conocimiento adquirido a nuevas situaciones", afirmó el informático Jiayuan Mao, jefe del proyecto de investigación compartida.

Esencialmente, este modelo de IA consta de un componente receptor de información, que convierte imágenes en interpretación basada en objetos, y una capa de lenguaje que extrae el significado de palabras y oraciones, para luego crear “programas simbólicos” que ayudan a la IA a saber cómo Responde la pregunta. Además, habrá un tercer módulo que ejecuta programas simbólicos en segundo plano y proporciona respuestas, actualizando el conocimiento al modelo de IA cuando comete errores.
Los investigadores entrenaron este modelo de IA con imágenes combinadas con muchas preguntas y respuestas relevantes. Luego, la Universidad de Stanford supervisó la capacidad de la IA para comprender imágenes. En general, la IA debe responder preguntas como: ¿Cuál es el color del objeto? ¿Cuántos objetos hay al lado de otro objeto? ¿O de qué material está hecho este objeto? La complejidad de las preguntas aumentará naturalmente con el nivel de comprensión del modelo de IA y, a medida que domine los conceptos a nivel de objeto, el modelo de IA aprenderá a establecer conexiones entre muchos objetos y sus propiedades juntas. esto puede considerarse una etapa avanzada.

En experimentos, se demostró que este modelo de IA es capaz de interpretar nuevas escenas y conceptos casi a la perfección, superando a otros sistemas de IA avanzados, mientras utiliza solo 5.000 imágenes y 100.000 preguntas (en comparación con las aproximadamente 70.000 imágenes y 700.000 preguntas de los modelos de IA convencionales). . En el futuro, el trabajo principal de los investigadores será mejorar el rendimiento del modelo de IA en la comprensión de fotografías del mundo real y luego avanzar gradualmente hacia la manipulación robótica y de vídeo.