Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikal

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikal

Penyelidik AI dari Carnegie Mellon University, Pennsylvania, Amerika Syarikat baru-baru ini berjaya membangunkan model AI yang mendalam, mampu menterjemah bahasa (teks, suara) kepada pergerakan dan gerak isyarat. fizik dengan ketepatan yang agak tinggi.

Model AI ini dinamakan Joint Language-to-Pose (JL2P), dan dikenali sebagai kaedah yang menyediakan keupayaan untuk menggabungkan bahasa semula jadi dengan model simulasi pose 3D yang berkesan apabila digunakan.aplikasi praktikal dalam masa terdekat.

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikalModel AI ini dinamakan Joint Language-to-Pose (JL2P).

Keupayaan JL2P untuk menganalisis dan mensimulasikan postur dan gerak isyarat dalam ruang 3D dilatih secara menyeluruh melalui program hujung ke hujung sepanjang - pendekatan yang berkuasa dan berkesan untuk pengaturcaraan. Program latihan "dipecahkan" kepada urutan individu. Model AI perlu menyelesaikan tugasan ringkas dan ringkas sebelum dibenarkan beralih kepada matlamat yang lebih kompleks.

Pada masa ini, keupayaan simulasi animasi JL2P terhad kepada imej asas (terdiri daripada garis lurus mudah), tetapi keupayaan untuk mensimulasikan pergerakan seperti manusia adalah berdasarkan bahasa model. Visualisasi AI ini agak tepat dan intuitif. Pasukan ini percaya bahawa model seperti JL2P suatu hari nanti boleh membantu robot melaksanakan tugas fizikal dunia sebenar yang serupa dengan manusia, atau membantu dalam penciptaan watak animasi maya untuk permainan video dan juga filem.

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikalKeupayaan simulasi animasi JL2P adalah terhad kepada imej asas dan ringkas

Sebenarnya, idea untuk membangunkan model AI dengan keupayaan untuk menterjemah bahasa ke dalam pergerakan fizikal bukanlah perkara baru. Sebelum Carnegie Mellon University memperkenalkan JL2P, Microsoft juga berjaya membangunkan model yang dipanggil ObjGAN, dengan tugas melakar imej dan papan cerita (papan yang melakar cerita yang ingin anda ceritakan dalam bentuk imej) daripada anotasi linguistik. Satu lagi model AI Disney juga terkenal dengan keupayaannya menggunakan perkataan dalam skrip untuk mencipta papan cerita. Atau yang paling terkenal ialah model GauGAN Nvidia , yang boleh menukar doodle seperti yang dibuat dengan pad jejak atau Microsoft Paint menjadi lakaran digital pintar dengan estetika yang sangat tinggi.

Berbalik kepada JL2P, model AI ini kini boleh mensimulasikan beberapa pergerakan dengan tepat kepada yang agak kompleks seperti berjalan atau berlari, bermain alat muzik (seperti gitar atau biola), mengikut arahan yang telah ditetapkan. arah (kiri atau kanan) atau kelajuan kawalan (cepat atau lambat).

  • Berjaya membangunkan "papan kekunci khayalan" untuk skrin sentuh dan VR, dikuasakan oleh AI

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikalJL2P kini boleh mensimulasikan dengan tepat beberapa pergerakan daripada yang mudah kepada yang agak kompleks

“Kami mula-mula mengoptimumkan model untuk meramalkan dua langkah masa berdasarkan ayat lengkap. Tugas mudah ini boleh membantu model AI belajar untuk mensimulasikan urutan postur yang sangat pendek, seperti pergerakan kaki semasa berjalan, pergerakan tangan semasa melambai, atau postur dan postur badan semasa tunduk. Sebaik sahaja JL2P telah mempelajari cara mensimulasikan gerak isyarat yang sama dengan ketepatan yang tinggi, kami meneruskan ke peringkat seterusnya dalam kurikulum. Model itu kini diberikan dua (bilangan) pose untuk diramal pada masa yang sama,” kata pasukan penyelidik Universiti Carnegie Mellon.

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikalMensimulasikan postur larian orang normal

Butiran cara operasi JL2P serta "karya" tipikal telah dibentangkan buat pertama kali dalam kertas saintifik yang diterbitkan pada 2 Julai di laman web arXiv.org, dan dijangka akan dibentangkan oleh panel pengarang dan penyelidik Institut Teknologi Bahasa CMU Chaitanya Ahuja pada 19 September, di pentas Persidangan Antarabangsa mengenai Visi 3D yang berlangsung di Quebec, Kanada.

Pasukan penyelidik dengan yakin menegaskan bahawa JL2P boleh mensimulasikan postur dan pergerakan fizikal 9% lebih tepat daripada model AI "top notch" lain yang dibangunkan oleh pakar AI SRI International. pada tahun 2018.

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikalJL2P mensimulasikan tindakan manusia berdiri dengan sebelah tangan

Produk yang dicipta oleh JL2P selepas dilatih dengan set data bahasa gerakan KIT (KIT Motion-Language Dataset).

Berjaya membangunkan model AI yang boleh menterjemahkan bahasa kepada pergerakan fizikalJL2P mensimulasikan tindakan melompat melepasi halangan dan berlari

Pertama kali diperkenalkan pada 2016 oleh Performance Humanoid Technologies, Jerman, set data perlombongan ini adalah gabungan pergerakan manusia dengan penerangan bahasa semula jadi, memetakan 11 jam pergerakan berterusan satu demi satu. orang, direkodkan ke dalam lebih daripada 6,200 ayat bahasa Inggeris, setiap satu kira-kira 8 perkataan panjang.


Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Badan yang menyatukan pemerhati privasi negara Eropah berkata pada hari Khamis ia telah menubuhkan pasukan petugas khusus untuk ChatGPT

AI meramalkan masa kematian manusia dengan ketepatan 78%.

AI meramalkan masa kematian manusia dengan ketepatan 78%.

Para saintis Denmark dan Amerika telah bekerjasama untuk membangunkan sistem AI yang dipanggil life2vec, yang mampu meramalkan masa kematian manusia dengan ketepatan yang tinggi.

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

Algoritma AI yang dipanggil Audioflow boleh mendengar bunyi kencing untuk mengenal pasti aliran tidak normal dan masalah kesihatan pesakit yang sepadan dengan berkesan dan berjaya.

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Penduduk Jepun yang semakin tua dan semakin berkurangan menyebabkan negara itu kekurangan sejumlah besar pekerja muda, terutamanya dalam sektor perkhidmatan.

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Pengguna Reddit bernama u/LegalBeagle1966 ialah salah satu daripada ramai pengguna yang terpikat dengan Claudia, seorang gadis seperti bintang filem yang sering berkongsi swafoto yang menggoda, malah bogel. di platform ini.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

Microsoft baru sahaja mengumumkan bahawa 12 lagi syarikat teknologi akan mengambil bahagian dalam program AI for Goodnya.

AI mencipta semula watak Dragon Ball dalam daging dan darah

AI mencipta semula watak Dragon Ball dalam daging dan darah

Pengguna @mortecouille92 telah meletakkan kuasa alat reka bentuk grafik Midjourney untuk berfungsi dan mencipta versi unik realistik watak Dragon Ball yang terkenal seperti Goku, Vegeta, Bulma dan Kame yang lebih tua. .

7 teknik untuk meningkatkan respons ChatGPT

7 teknik untuk meningkatkan respons ChatGPT

Hanya dengan menambah beberapa syarat atau menyediakan beberapa senario, ChatGPT boleh memberikan jawapan yang lebih berkaitan kepada pertanyaan anda. Mari lihat beberapa cara anda boleh meningkatkan kualiti respons ChatGPT anda.

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Midjourney ialah sistem kecerdasan buatan yang baru-baru ini menyebabkan "demam" dalam komuniti dalam talian dan dunia artis kerana lukisannya yang sangat cantik yang tidak kalah dengan lukisan artis sebenar.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Beberapa hari selepas China mengumumkan wabak itu, dengan akses kepada data jualan tiket penerbangan global, sistem AI BlueDot terus meramalkan dengan tepat penyebaran virus Wuhan Corona ke Bangkok, Seoul, Taipei dan Tokyo.