El modelo de IA utiliza datos aéreos y terrestres para navegar a zonas difíciles de observar

¿Pueden los modelos de inteligencia artificial ayudar a navegar por áreas (calles) en las que nunca antes han sido entrenados o para las cuales no han recibido suficientes datos de entrenamiento? Eso es lo que preocupa a los científicos del equipo de desarrollo de inteligencia artificial DeepMind. Y después de muchos años de incubación, los científicos finalmente lograron el éxito en un proyecto de investigación llamado: "Cross-View Policy Learning for Street Navigation", revelado recientemente en un artículo publicado en Arxiv.org.

En esta investigación, los científicos de DeepMind describen el desarrollo de una política de IA entrenada a partir de un rico almacén de datos con muchos ángulos (principalmente imágenes tomadas de arriba a abajo), dirigidas a diferentes áreas de la ciudad, para una eficiencia de observación más óptima. Los investigadores creen que este enfoque conduciría a mejores resultados de generalización.

La diferencia entre IA (Inteligencia Artificial) y Computación Cognitiva (Cognitive Computing)

En esencia, esta investigación se inspira en el hecho de que las personas pueden adaptarse rápidamente al diseño y la estructura básica de una nueva ciudad examinando cuidadosamente el mapa de esa ciudad muchas veces.

“La capacidad de navegar a partir de observaciones visuales en entornos desconocidos es un componente central en el estudio de la capacidad de los modelos de IA para aprender a navegar. La capacidad de los modelos de IA para navegar por las calles en los casos en los que faltan datos de entrenamiento ha sido hasta ahora relativamente limitada, y confiar en modelos de simulación no es una solución que pueda ser efectiva a largo plazo. Nuestra idea central es combinar la vista terrestre con la vista aérea y explorar políticas comunes que puedan permitir el cambio entre vistas”, dijo un representante del equipo de investigación.

Google lanza un enorme almacén de datos de entrenamiento de IA con más de 5 millones de fotografías de 200.000 puntos de referencia en todo el mundo

Más concretamente, el primer paso que tendrán que dar los investigadores será recopilar mapas aéreos de la zona por la que pretenden navegar (combinados con modos de observación de calles basados en coordenadas geográficas correspondientes). A continuación, se embarcaron en una misión de teletransportación de tres partes, comenzando con entrenamiento sobre los datos y ajustando el área de origen mediante observaciones aéreas del área, y terminando con el movimiento al área objetivo mediante observaciones terrestres.

El sistema de aprendizaje automático del equipo de investigación contiene un conjunto de 3 módulos separados, que incluyen:

Módulo convolucional, responsable de la percepción visual.
El módulo de memoria a corto plazo (LSTM) es responsable de recuperar características específicas de la ubicación.
El módulo neuronal recurrente de políticas ayuda a crear divisiones a través de acciones.

Este modelo de aprendizaje automático se implementó en StreetAir, un entorno callejero al aire libre con múltiples perspectivas, construido sobre StreetLearn. (StreetLearn es la primera colección interactiva de fotografías panorámicas extraídas de Google Street View y Google Maps).

El modelo de IA utiliza datos aéreos y terrestres para navegar a zonas difíciles de observar

La IA utiliza tweets para ayudar a los investigadores a analizar situaciones de inundaciones

En StreetAir y StreetLearn, las imágenes aéreas que contienen vistas panorámicas de la ciudad de Nueva York (incluidos el centro de Nueva York y Midtown NYC) y Pittsburgh (campus de Allegheny College y Carnegie Mellon University) están organizadas de manera que en cada latitud, grados y longitudes de coordenadas, el entorno vuelve a ser aéreo. imágenes en un tamaño de 84 x 84, el mismo tamaño que las imágenes desde el suelo.

El sistema de inteligencia artificial, después de recibir capacitación, tendrá la tarea de aprender a localizar y navegar en un gráfico de imágenes panorámicas de Street View con las coordenadas de longitud y latitud del destino.

Los panoramas cubren áreas de 2 a 5 km de lado, a unos 10 m de distancia, y los vehículos (controlados por IA) podrán realizar 1 de 5 acciones por turno: avanzar, girar a la izquierda o a la derecha 22,5 grados o girar a la izquierda o a la derecha 67,5. grados.

Al acercarse a la ubicación objetivo dentro de 100 a 200 metros, estos vehículos recibirán "recompensas" para alentarlos a identificar y pasar las intersecciones de manera rápida y precisa.

El modelo de IA utiliza datos aéreos y terrestres para navegar a zonas difíciles de observar

El modelo de IA del MIT puede capturar relaciones entre objetos por sí solo con datos de entrenamiento mínimos

En experimentos, los vehículos que aprovecharon imágenes aéreas para adaptarse a nuevos entornos lograron métricas de recompensa de 190 a 100 millones de pasos y 280 a 200 millones de pasos, ambas significativamente más altas en comparación con los vehículos que utilizan solo datos de observación terrestre (50 a 100 millones de pasos y 200 a 200 millones de pasos). millones de pasos). Según los investigadores, los resultados mostraron que su método mejora significativamente la capacidad de los vehículos para adquirir conocimientos de forma más eficaz sobre múltiples áreas de la ciudad objetivo.

Tags: #Artificial Intelligence (AI)

Los restaurantes de sushi japoneses utilizan IA para evaluar la calidad de cada trozo de atún con gran precisión

Una cadena de restaurantes de sushi japonesa llamada Dentsu Inc acaba de desarrollar con éxito una aplicación llamada Tuna Scope, que utiliza IA para evaluar la calidad del atún con un alto nivel de precisión, no inferior al de los chefs más experimentados.

Una mirada a los precios de Slack: un breve recorrido por los planes de Slacks

Slack ha adoptado el modelo de negocio SaaS y ofrece varios planes diferentes para satisfacer las necesidades de su organización. He aquí un breve recorrido por las opciones.

¿Qué es Claude Pro? ¿Cómo se compara Claude Pro con ChatGPT Plus?

Descubre Claude Pro, la versión premium de Claude AI Chatbot, y cómo se compara con ChatGPT Plus, optimizando tu experiencia en inteligencia artificial.

Europa establecerá el grupo de trabajo ChatGPT

El organismo que une a los organismos nacionales de vigilancia de la privacidad de Europa dijo el jueves que había creado un grupo de trabajo dedicado a ChatGPT.

La IA predice la hora de la muerte humana con un 78% de precisión

Científicos daneses y estadounidenses han colaborado para desarrollar un sistema de inteligencia artificial llamado life2vec, capaz de predecir el momento de la muerte humana con gran precisión.

La IA predice enfermedades urinarias sólo por el sonido de la orina

Un algoritmo de inteligencia artificial llamado Audioflow puede escuchar el sonido de la micción para identificar de manera efectiva y exitosa los flujos anormales y los correspondientes problemas de salud del paciente.

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

El envejecimiento y la disminución de la población de Japón han dejado al país sin un número significativo de trabajadores jóvenes, especialmente en el sector de servicios.

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

Un usuario de Reddit llamado u/LegalBeagle1966 es uno de los muchos usuarios enamorados de Claudia, una chica con apariencia de estrella de cine que a menudo comparte seductores selfies, incluso desnudos, en esta plataforma.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

Microsoft acaba de anunciar que 12 empresas tecnológicas más participarán en su programa AI for Good.

La IA recrea personajes de Dragon Ball en carne y hueso

El usuario @mortecouille92 ha puesto a trabajar el poder de la herramienta de diseño gráfico Midjourney y ha creado versiones excepcionalmente realistas de personajes famosos de Dragon Ball como Goku, Vegeta, Bulma y el anciano Kame. .

El modelo de IA utiliza datos aéreos y terrestres para navegar a zonas difíciles de observar

Leave a Comment

Los restaurantes de sushi japoneses utilizan IA para evaluar la calidad de cada trozo de atún con gran precisión

Una mirada a los precios de Slack: un breve recorrido por los planes de Slacks

¿Qué es Claude Pro? ¿Cómo se compara Claude Pro con ChatGPT Plus?

Europa establecerá el grupo de trabajo ChatGPT

La IA predice la hora de la muerte humana con un 78% de precisión

La IA predice enfermedades urinarias sólo por el sonido de la orina

Bartenders, cuidado: este robot puede preparar un cóctel en sólo 1 minuto

Cientos de personas se desilusionaron al saber que la chica que amaban era producto de la IA.

12 empresas potenciales más se unen a la alianza de IA de Microsoft.

La IA recrea personajes de Dragon Ball en carne y hueso