Développement réussi dun modèle dIA capable de traduire le langage en mouvements physiques

Développement réussi dun modèle dIA capable de traduire le langage en mouvements physiques

Des chercheurs en IA de l'Université Carnegie Mellon, en Pennsylvanie, aux États-Unis, ont récemment développé avec succès un modèle d'IA profond, capable de traduire les langages (texte, voix) en mouvements et en gestes physiques avec une précision relativement élevée.

Ce modèle d'IA s'appelle Joint Language-to-Pose (JL2P) et est connu comme une méthode qui offre la possibilité de combiner le langage naturel avec des modèles de simulation de pose 3D efficaces lorsqu'elle sera utilisée dans une application pratique dans un avenir proche.

Développement réussi d'un modèle d'IA capable de traduire le langage en mouvements physiquesCe modèle d'IA s'appelle Joint Language-to-Pose (JL2P).

La capacité de JL2P à analyser et simuler la posture et les gestes dans l'espace 3D est minutieusement entraînée à travers des programmes de bout en bout - une approche puissante et efficace de la programmation. Le programme de formation est « décomposé » en séquences individuelles. Le modèle d’IA devra accomplir des tâches courtes et simples avant de pouvoir passer à des objectifs plus complexes.

Actuellement, les capacités de simulation d'animation de JL2P sont limitées à des images rudimentaires (constituées de simples lignes droites), mais la capacité de simuler des mouvements humains repose sur le langage du modèle. Cette visualisation IA est relativement précise et intuitive. L'équipe pense que des modèles comme JL2P pourraient un jour aider les robots à effectuer des tâches physiques réelles similaires à celles des humains, ou aider à la création de personnages virtuels animés pour les jeux vidéo ainsi que pour les films.

Développement réussi d'un modèle d'IA capable de traduire le langage en mouvements physiquesLes capacités de simulation d'animation de JL2P sont limitées à des images simples et rudimentaires

En fait, l’idée de développer un modèle d’IA capable de traduire le langage en mouvements physiques n’est pas nouvelle. Avant que l'Université Carnegie Mellon n'introduise JL2P, Microsoft a également développé avec succès un modèle appelé ObjGAN, avec pour tâche de dessiner des images et des storyboards (un tableau qui dessine l'histoire que vous souhaitez raconter sous forme d'image) à partir d'annotations linguistiques. Un autre modèle d'IA de Disney est également largement connu pour sa capacité à utiliser les mots du script pour créer des storyboards. Le plus célèbre est le modèle GauGAN de Nvidia , qui peut transformer un doodle créé avec un trackpad ou Microsoft Paint en croquis numériques intelligents dotés d'une esthétique extrêmement élevée.

Pour en revenir à JL2P, ce modèle d'IA peut désormais simuler très précisément un certain nombre de mouvements du plus simple au relativement complexe comme marcher ou courir, jouer d'instruments de musique (comme la guitare ou le violon), suivre des instructions prédéterminées de direction (gauche ou droite) ou de vitesse. contrôle (rapide ou lent).

  • Développement réussi d'un "clavier imaginaire" pour écrans tactiles et VR, alimenté par l'IA

Développement réussi d'un modèle d'IA capable de traduire le langage en mouvements physiquesJL2P peut désormais simuler très précisément un certain nombre de mouvements allant du simple au relativement complexe.

« Nous avons d’abord optimisé le modèle pour prédire deux pas de temps basés sur des phrases complètes. Cette tâche simple peut aider le modèle d'IA à apprendre à simuler des séquences de postures très courtes, telles que les mouvements des jambes en marchant, les mouvements des mains en agitant, ou la posture et la posture du corps en s'inclinant. Une fois que JL2P a appris à simuler les mêmes gestes avec une grande précision, on passe à l'étape suivante du cursus. Le modèle dispose désormais de deux (nombres) de poses à prédire en même temps », a déclaré l'équipe de recherche de l'Université Carnegie Mellon.

Développement réussi d'un modèle d'IA capable de traduire le langage en mouvements physiquesSimule la posture de course d'une personne normale

Les détails du mode de fonctionnement du JL2P ainsi que des « travaux » typiques ont été présentés pour la première fois dans un article scientifique publié le 2 juillet sur le site arXiv.org, et devraient être présentés par le panel d'auteurs et de chercheurs de l'Institut de technologie du langage CMU Chaitanya Ahuja le 19 septembre, sur la scène de la Conférence internationale sur la vision 3D qui se déroule à Québec, Canada.

L'équipe de recherche affirme avec confiance que JL2P peut simuler la posture et les mouvements physiques avec 9 % de plus de précision qu'un autre modèle d'IA « de premier ordre » développé par les experts en IA de SRI International en 2018.

Développement réussi d'un modèle d'IA capable de traduire le langage en mouvements physiquesJL2P simule l'action humaine consistant à se lever d'une seule main

Produit créé par JL2P après avoir été formé avec l'ensemble de données de langage de mouvement KIT (KIT Motion-Language Dataset).

Développement réussi d'un modèle d'IA capable de traduire le langage en mouvements physiquesJL2P simule l'action de sauter par-dessus des obstacles et de courir

Introduit pour la première fois en 2016 par Performance Humanoid Technologies, Allemagne, cet ensemble de données minières est une combinaison de mouvements humains avec des descriptions en langage naturel, cartographiant 11 heures de mouvement continu, une par une, enregistrées dans plus de 6 200 phrases en anglais, chacune d'environ 8 mots. long.


Le groupe de travail ChatGPT sera créé par l’Europe

Le groupe de travail ChatGPT sera créé par l’Europe

L'organisme qui rassemble les organismes nationaux de surveillance de la vie privée en Europe a annoncé jeudi avoir créé un groupe de travail dédié à ChatGPT.

LIA prédit lheure de la mort humaine avec une précision de 78 %

LIA prédit lheure de la mort humaine avec une précision de 78 %

Des scientifiques danois et américains ont collaboré pour développer un système d'IA appelé life2vec, capable de prédire l'heure de la mort humaine avec une grande précision.

L’IA prédit les maladies urinaires rien qu’au son de l’urine

L’IA prédit les maladies urinaires rien qu’au son de l’urine

Un algorithme d’IA appelé Audioflow peut écouter le bruit de la miction pour identifier efficacement et avec succès les flux anormaux et les problèmes de santé correspondants du patient.

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

Barmans, attention : ce robot peut préparer un cocktail en 1 minute seulement

En raison du vieillissement et du déclin de la population japonaise, le pays manque d'un nombre important de jeunes travailleurs, notamment dans le secteur des services.

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Des centaines de personnes ont été déçues lorsqu’elles ont appris que la fille qu’ils aimaient était un produit de l’IA

Un utilisateur de Reddit nommé u/LegalBeagle1966 est l'un des nombreux utilisateurs amoureux de Claudia, une fille ressemblant à une star de cinéma qui partage souvent des selfies séduisants, même nus, sur cette plateforme.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

12 autres entreprises potentielles rejoignent « lalliance IA » de Microsoft.

Microsoft vient d'annoncer que 12 autres entreprises technologiques participeront à son programme AI for Good.

LIA recrée les personnages de Dragon Ball en chair et en os

LIA recrée les personnages de Dragon Ball en chair et en os

L'utilisateur @mortecouille92 a mis à profit la puissance de l'outil de conception graphique Midjourney et a créé des versions réalistes uniques de personnages célèbres de Dragon Ball comme Goku, Vegeta, Bulma et l'aîné Kame. .

7 techniques pour améliorer les réponses ChatGPT

7 techniques pour améliorer les réponses ChatGPT

En ajoutant simplement quelques conditions ou en mettant en place des scénarios, ChatGPT peut donner des réponses plus pertinentes à vos requêtes. Examinons quelques façons d'améliorer la qualité de vos réponses ChatGPT.

Émerveillez-vous devant les magnifiques peintures dessinées par lintelligence artificielle

Émerveillez-vous devant les magnifiques peintures dessinées par lintelligence artificielle

Midjourney est un système d'intelligence artificielle qui a récemment provoqué une "fièvre" dans la communauté en ligne et dans le monde des artistes en raison de ses peintures extrêmement belles qui ne sont pas inférieures à celles de vrais artistes.

Ce modèle dIA a été lun des premiers « experts » à découvrir des nouvelles sur lépidémie de pneumonie de Wuhan.

Ce modèle dIA a été lun des premiers « experts » à découvrir des nouvelles sur lépidémie de pneumonie de Wuhan.

Quelques jours après que la Chine a annoncé l'épidémie, grâce à l'accès aux données mondiales sur les ventes de billets d'avion, le système d'IA de BlueDot a continué à prédire avec précision la propagation du virus Corona de Wuhan à Bangkok, Séoul, Taipei et Tokyo.