Model AI menggunakan data udara dan darat untuk menavigasi ke kawasan yang sukar untuk diperhatikan

Model AI menggunakan data udara dan darat untuk menavigasi ke kawasan yang sukar untuk diperhatikan

Bolehkah model kecerdasan buatan membantu menavigasi melalui kawasan (jalan) yang mereka tidak pernah dilatih sebelum ini, atau yang mereka tidak diberi data latihan yang mencukupi? Itulah yang dibimbangkan oleh saintis di pasukan pembangunan kecerdasan buatan DeepMind. Dan selepas bertahun-tahun inkubasi, saintis akhirnya mencapai kejayaan dalam projek penyelidikan yang dipanggil: "Pembelajaran Dasar Pandangan Silang untuk Navigasi Jalan", baru-baru ini didedahkan dalam artikel yang diterbitkan di Arxiv.org.

Dalam penyelidikan ini, saintis DeepMind menerangkan pembangunan dasar AI yang dilatih daripada gudang data yang kaya dengan banyak sudut (kebanyakannya imej diambil dari atas ke bawah), Menyasarkan kawasan bandar yang berbeza, untuk kecekapan pemerhatian yang lebih optimum. Para penyelidik percaya bahawa pendekatan sedemikian akan membawa kepada hasil generalisasi yang lebih baik.

Model AI menggunakan data udara dan darat untuk menavigasi ke kawasan yang sukar untuk diperhatikan

Pada dasarnya, penyelidikan ini diilhamkan oleh fakta bahawa orang ramai boleh dengan cepat menyesuaikan diri dengan susun atur dan struktur asas bandar baharu dengan teliti memeriksa peta bandar itu berkali-kali.

“Keupayaan untuk menavigasi daripada pemerhatian visual dalam persekitaran yang tidak dikenali adalah komponen teras dalam mengkaji keupayaan model AI untuk mempelajari navigasi. Keupayaan model AI untuk menavigasi jalanan dalam kes di mana terdapat kekurangan data latihan setakat ini agak terhad, dan bergantung pada model simulasi bukanlah penyelesaian yang boleh berkesan dalam jangka panjang. Idea teras kami adalah untuk menggandingkan pandangan darat dengan pandangan udara dan meneroka dasar biasa yang boleh membolehkan pertukaran antara pandangan," kata wakil pasukan penyelidik itu.

Lebih khusus lagi, langkah pertama yang perlu dilakukan oleh penyelidik ialah mengumpul peta udara bagi kawasan yang mereka ingin navigasi (digabungkan dengan mod cerapan jalan berdasarkan koordinat geografi). sebab yang sepadan). Seterusnya, mereka memulakan misi teleportasi tiga bahagian, bermula dengan latihan mengenai data dan menyesuaikan kawasan sumber menggunakan pemerhatian udara di kawasan tersebut, dan berakhir dengan pergerakan ke kawasan sasaran menggunakan pemerhatian tanah.

Sistem pembelajaran mesin pasukan penyelidik mengandungi satu set 3 modul berasingan, termasuk:

  • Modul konvolusi, bertanggungjawab untuk persepsi visual.
  • Modul ingatan jangka pendek panjang (LSTM) bertanggungjawab untuk mendapatkan semula ciri khusus lokasi.
  • Modul saraf berulang dasar membantu mewujudkan pembahagian melalui tindakan.

Model pembelajaran mesin ini digunakan dalam StreetAir - persekitaran jalan luar berbilang perspektif - dibina di atas StreetLearn. (StreetLearn ialah koleksi interaktif pertama foto panorama yang diekstrak daripada Google Street View dan Peta Google).

Model AI menggunakan data udara dan darat untuk menavigasi ke kawasan yang sukar untuk diperhatikan

Dalam StreetAir dan StreetLearn, imej udara yang mengandungi pemandangan panoramik New York City (termasuk Downtown NYC dan Midtown NYC) dan Pittsburgh (kampus Allegheny College dan Carnegie Mellon University) disusun supaya pada setiap latitud menyelaras darjah dan longitud, persekitaran mengembalikan udara imej pada saiz 84 x 84, saiz yang sama dengan imej dari tanah.

Sistem AI, selepas menjalani latihan, akan ditugaskan untuk mempelajari cara menyetempatkan dan menavigasi carta imej Street View panoramik dengan koordinat longitud dan latitud destinasi.

Panorama meliputi kawasan dari 2-5km di sebelah, jarak kira-kira 10m, dan kenderaan (dikawal AI) akan dibenarkan melakukan 1 daripada 5 tindakan setiap pusingan: bergerak ke hadapan, belok kiri atau kanan 22.5 darjah atau belok kiri atau kanan 67.5 darjah.

Apabila menghampiri lokasi sasaran dalam lingkungan 100-200 meter, kenderaan ini akan menerima "ganjaran" untuk menggalakkan mengenal pasti dan melepasi persimpangan dengan cepat dan tepat.

Model AI menggunakan data udara dan darat untuk menavigasi ke kawasan yang sukar untuk diperhatikan

Dalam eksperimen, kenderaan yang mengeksploitasi imej udara untuk menyesuaikan diri dengan persekitaran baharu mencapai metrik ganjaran sebanyak 190 pada 100 juta langkah dan 280 pada 200 juta langkah, kedua-duanya jauh lebih tinggi berbanding kenderaan yang hanya menggunakan data pemerhatian darat (50 pada 100 juta langkah dan 200 pada 200 langkah. juta langkah). Menurut para penyelidik, keputusan menunjukkan bahawa kaedah mereka meningkatkan keupayaan kenderaan untuk memperoleh pengetahuan dengan lebih berkesan tentang pelbagai kawasan di bandar sasaran.


Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Badan yang menyatukan pemerhati privasi negara Eropah berkata pada hari Khamis ia telah menubuhkan pasukan petugas khusus untuk ChatGPT

AI meramalkan masa kematian manusia dengan ketepatan 78%.

AI meramalkan masa kematian manusia dengan ketepatan 78%.

Para saintis Denmark dan Amerika telah bekerjasama untuk membangunkan sistem AI yang dipanggil life2vec, yang mampu meramalkan masa kematian manusia dengan ketepatan yang tinggi.

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

Algoritma AI yang dipanggil Audioflow boleh mendengar bunyi kencing untuk mengenal pasti aliran tidak normal dan masalah kesihatan pesakit yang sepadan dengan berkesan dan berjaya.

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Penduduk Jepun yang semakin tua dan semakin berkurangan menyebabkan negara itu kekurangan sejumlah besar pekerja muda, terutamanya dalam sektor perkhidmatan.

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Pengguna Reddit bernama u/LegalBeagle1966 ialah salah satu daripada ramai pengguna yang terpikat dengan Claudia, seorang gadis seperti bintang filem yang sering berkongsi swafoto yang menggoda, malah bogel. di platform ini.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

Microsoft baru sahaja mengumumkan bahawa 12 lagi syarikat teknologi akan mengambil bahagian dalam program AI for Goodnya.

AI mencipta semula watak Dragon Ball dalam daging dan darah

AI mencipta semula watak Dragon Ball dalam daging dan darah

Pengguna @mortecouille92 telah meletakkan kuasa alat reka bentuk grafik Midjourney untuk berfungsi dan mencipta versi unik realistik watak Dragon Ball yang terkenal seperti Goku, Vegeta, Bulma dan Kame yang lebih tua. .

7 teknik untuk meningkatkan respons ChatGPT

7 teknik untuk meningkatkan respons ChatGPT

Hanya dengan menambah beberapa syarat atau menyediakan beberapa senario, ChatGPT boleh memberikan jawapan yang lebih berkaitan kepada pertanyaan anda. Mari lihat beberapa cara anda boleh meningkatkan kualiti respons ChatGPT anda.

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Midjourney ialah sistem kecerdasan buatan yang baru-baru ini menyebabkan "demam" dalam komuniti dalam talian dan dunia artis kerana lukisannya yang sangat cantik yang tidak kalah dengan lukisan artis sebenar.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Beberapa hari selepas China mengumumkan wabak itu, dengan akses kepada data jualan tiket penerbangan global, sistem AI BlueDot terus meramalkan dengan tepat penyebaran virus Wuhan Corona ke Bangkok, Seoul, Taipei dan Tokyo.