Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczne

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczne

Badacze AI z Carnegie Mellon University w Pensylwanii w USA niedawno z sukcesem opracowali głęboki model sztucznej inteligencji, potrafiący ze stosunkowo dużą precyzją tłumaczyć języki (tekst, głos) na ruchy i gesty.

Ten model sztucznej inteligencji nosi nazwę Joint Language-to-Pose (JL2P) i jest znany jako metoda zapewniająca możliwość łączenia języka naturalnego z efektywnymi modelami symulacji pozy 3D, gdy jest używany. Praktyczne zastosowanie w niedalekiej przyszłości.

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczneTen model sztucznej inteligencji nosi nazwę Joint Language-to-Pose (JL2P).

Zdolność JL2P do analizowania i symulowania postawy i gestów w przestrzeni 3D jest dokładnie szkolona poprzez kompleksowe programy - potężne i skuteczne podejście do programowania.Program szkoleniowy jest „podział” na indywidualne sekwencje. Model sztucznej inteligencji będzie musiał wykonać krótkie, proste zadania, zanim będzie mógł przejść do bardziej złożonych celów.

Obecnie możliwości symulacji animacji JL2P ograniczają się do podstawowych obrazów (składających się z prostych linii prostych), ale możliwość symulowania ruchów przypominających ludzkie opiera się na języku modelu.Ta wizualizacja AI jest stosunkowo dokładna i intuicyjna. Zespół wierzy, że modele takie jak JL2P mogą pewnego dnia pomóc robotom wykonywać w świecie rzeczywistym zadania fizyczne podobne do ludzi lub pomóc w tworzeniu wirtualnych animowanych postaci do gier wideo, a także filmów.

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczneMożliwości symulacji animacji JL2P ograniczają się do podstawowych, prostych obrazów

Właściwie pomysł opracowania modelu AI z możliwością przekładania języka na ruchy fizyczne nie jest nowy. Zanim Uniwersytet Carnegie Mellon wprowadził JL2P, Microsoft z powodzeniem opracował model o nazwie ObjGAN, którego zadaniem jest szkicowanie obrazów i scenorysów (tablicy, która szkicuje historię, którą chcesz opowiedzieć w formie obrazu) na podstawie adnotacji językowych. Inny model sztucznej inteligencji Disneya jest również powszechnie znany ze swojej możliwości wykorzystania słów zawartych w scenariuszu do tworzenia scenorysów. Najbardziej znany jest model GauGAN firmy Nvidia , który może zamienić doodle utworzone za pomocą gładzika lub programu Microsoft Paint w inteligentne cyfrowe szkice o niezwykle wysokiej estetyce.

Wracając do JL2P, ten model sztucznej inteligencji może teraz bardzo dokładnie symulować szereg ruchów, od prostych do stosunkowo złożonych, takich jak chodzenie lub bieganie, gra na instrumentach muzycznych (takich jak gitara lub skrzypce), postępując zgodnie z wcześniej określonymi instrukcjami, kierunek (w lewo lub w prawo) lub prędkość kontrola (szybka lub wolna).

  • Pomyślnie opracowano „wyimaginowaną klawiaturę” dla ekranów dotykowych i rzeczywistości wirtualnej, obsługiwaną przez sztuczną inteligencję

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczneJL2P może teraz bardzo dokładnie symulować wiele ruchów, od prostych do stosunkowo złożonych

„Najpierw zoptymalizowaliśmy model, aby przewidzieć dwa etapy czasowe na podstawie pełnych zdań. To proste zadanie może pomóc modelowi AI nauczyć się symulować bardzo krótkie sekwencje pozycji, takie jak ruchy nóg podczas chodzenia, ruchy rąk podczas machania lub postawa i postawa ciała podczas kłaniania się. Gdy JL2P nauczy się symulować te same gesty z dużą dokładnością, przechodzimy do kolejnego etapu programu nauczania. Model ma teraz dwie (liczby) pozycji do przewidzenia w tym samym czasie” – powiedział zespół badawczy z Carnegie Mellon University.

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczneSymuluje postawę biegową normalnej osoby

Szczegóły dotyczące sposobu działania JL2P oraz typowe „prace” zostały po raz pierwszy zaprezentowane w artykule naukowym opublikowanym 2 lipca na stronie arXiv.org i mają zostać zaprezentowane przez panel autorów i badaczy w Instytucie Technologii Językowej CMU Caitanya Ahuja w dniu 19 września na scenie Międzynarodowej Konferencji na temat Wizji 3D odbywającej się w Quebecu w Kanadzie.

Zespół badawczy z pewnością twierdzi, że JL2P może symulować postawę i ruchy fizyczne o 9% dokładniej niż inny „najwyższej klasy” model sztucznej inteligencji opracowany przez ekspertów AI z SRI International w 2018 roku.

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczneJL2P symuluje działanie człowieka polegające na wstawaniu jedną ręką

Produkt stworzony przez JL2P po przeszkoleniu przy użyciu zestawu danych języka ruchu KIT (zestaw danych języka ruchu KIT).

Pomyślnie opracowano model sztucznej inteligencji, który może przełożyć język na ruchy fizyczneJL2P symuluje akcję skakania przez przeszkody i biegania

Ten zbiór danych wydobywczych, wprowadzony po raz pierwszy w 2016 r. przez firmę Performance Humanoid Technologies w Niemczech, stanowi połączenie ruchu ludzkiego z opisami w języku naturalnym i odwzorowuje 11 godzin ciągłego ruchu, pojedynczo. Ludzie, zarejestrowani w ponad 6200 angielskich zdań, każde około 8 słów długi.


Europa utworzy grupę zadaniową ChatGPT

Europa utworzy grupę zadaniową ChatGPT

Organ zrzeszający krajowe organy nadzorujące prywatność w Europie poinformował w czwartek, że powołał grupę zadaniową zajmującą się ChatGPT

AI przewiduje czas śmierci człowieka z 78% dokładnością

AI przewiduje czas śmierci człowieka z 78% dokładnością

Duńscy i amerykańscy naukowcy współpracowali nad opracowaniem systemu sztucznej inteligencji o nazwie life2vec, zdolnego do przewidywania czasu śmierci człowieka z dużą dokładnością.

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Algorytm sztucznej inteligencji o nazwie Audioflow może nasłuchiwać dźwięku oddawania moczu, aby skutecznie i skutecznie identyfikować nieprawidłowe wypływy moczu i powiązane z nimi problemy zdrowotne pacjenta.

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Starzenie się i spadek liczby ludności Japonii spowodował, że w kraju brakuje znacznej liczby młodych pracowników, szczególnie w sektorze usług.

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Użytkownik Reddita o imieniu u/LegalBeagle1966 jest jednym z wielu użytkowników zakochanych w Claudii, dziewczynie przypominającej gwiazdę filmową, która często udostępnia na tej platformie uwodzicielskie selfie, nawet nagie.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

Microsoft właśnie ogłosił, że w jego programie AI for Good weźmie udział 12 kolejnych firm technologicznych.

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Użytkownik @mortecouille92 wykorzystał moc narzędzia do projektowania graficznego Midjourney i stworzył wyjątkowo realistyczne wersje słynnych postaci Dragon Ball, takich jak Goku, Vegeta, Bulma i starszy Kame. .

7 technik poprawy odpowiedzi ChatGPT

7 technik poprawy odpowiedzi ChatGPT

Po prostu dodając pewne warunki lub konfigurując pewne scenariusze, ChatGPT może udzielić bardziej trafnych odpowiedzi na Twoje zapytania. Przyjrzyjmy się sposobom poprawy jakości odpowiedzi ChatGPT.

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Midjourney to system sztucznej inteligencji, który wywołał ostatnio „gorączkę” w społeczności internetowej i świecie artystów ze względu na niezwykle piękne obrazy, które nie ustępują tym, które tworzą prawdziwi artyści.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Kilka dni po ogłoszeniu przez Chiny wybuchu epidemii, mając dostęp do danych dotyczących globalnej sprzedaży biletów lotniczych, system sztucznej inteligencji BlueDot w dalszym ciągu dokładnie przewidywał rozprzestrzenianie się wirusa korona z Wuhan do Bangkoku, Seulu, Tajpej i Tokio.