Récemment, le PDG Mark Zuckerberg a publié sur sa page personnelle Facebook une vidéo avec le contenu "Toutes ces vidéos sont créées par un système d'IA appelé Make-A-Video, capable de créer des vidéos via une description".
Dans la vidéo de 20 secondes se trouvent de très courtes vidéos présentant le contenu d'un ours en peluche dessinant un autoportrait, un vaisseau spatial atterrissant sur Mars et un robot surfant. Toutes ces vidéos ont été créées par le nouveau programme d'IA de Meta.
La vidéo créée par Make-A-Video de Meta est considérée comme incomplète car sa résolution est faible, le cadre est saccadé et les personnages ne bougent pas de manière fluide. Mais la vidéo montre que la recherche sur l’IA prend une nouvelle direction en transformant du texte en vidéo.
Zuckerberg a ajouté que, comparé à la conversion de texte en images, la création de vidéos à partir de texte est beaucoup plus difficile car l'IA doit non seulement créer avec précision chaque pixel, mais également prédire comment ils évolueront au fil du temps.
Selon les experts, des outils comme Make-A-Video s'amélioreront avec le temps, rendant la création vidéo beaucoup plus facile à l'avenir. Cependant, de nombreuses personnes ne peuvent s'empêcher de craindre que ces outils puissent être utilisés à de mauvaises fins, car les vidéos sont beaucoup plus difficiles à contrôler que les images.
Un expert estime que les modèles d’IA de type texte-image formés à partir de données Internet sont susceptibles d’exagérer les préjugés sociaux. Pour la vidéo, la formation doit être basée sur des ensembles de données pouvant inclure des millions d’images et de textes, ce qui rend extrêmement difficile le contrôle de l’ensemble de ce contenu.
Zuckerberg a déclaré que Make-A-Video serait partagé sous forme de code open source à l'avenir. Mais les solutions pour limiter ses effets néfastes n'ont pas été évoquées par le PDG de Meta.