AI baharu DeepMind boleh menguasai permainan yang kompleks tanpa latihan permainan terlebih dahulu

Platform kecerdasan buatan DeepMind telah menjadi terkenal di seluruh dunia dalam beberapa tahun kebelakangan ini berkat penguasaan cemerlang mereka dalam permainan kompleks, "intensif otak" seperti catur dan shogi. dan Go. Dari masa ke masa, mereka secara beransur-ansur "berkembang", mengalahkan pemain daging dan darah kami dengan teknik pembelajaran mesin lanjutan.

Pada 2016, DeepMind memperkenalkan AlphaGo, sistem AI dengan keupayaan permainan yang sangat baik. Setahun kemudian, syarikat itu terus melancarkan AlphaGo Zero. Ini adalah pengganti yang sempurna kepada AlphaGo, yang mempunyai keupayaan untuk belajar bermain Go hanya melalui pemerhatian perlawanan manusia, kemudian kuasai permainan dengan bermain menentang diri anda sendiri. Kemudian terdapat AlphaZero, sistem AI yang lebih unggul dengan keupayaan untuk bermain Go, catur dan shogi secara serentak dengan hanya satu algoritma.

Walau bagaimanapun, perkara biasa algoritma AI di atas ialah mereka semua perlu menjalani latihan mendalam tentang permainan serta peraturan permainan untuk dapat menguasai permainan tertentu. Ini adalah proses yang rumit dan agak memakan masa.

Untuk menyelesaikan masalah itu, DeepMind baru sahaja melancarkan sistem AI baharu yang sangat unggul dipanggil MuZero. AI ini mampu bermain Go, catur, shogi dan satu set permainan Atari dengan lancar tanpa perlu dilatih sebelum ini mengenai set peraturan permainan di atas. Ia akan mempelajari semuanya sendiri, dan kemudian boleh memainkan permainan ini juga atau lebih baik daripada mana-mana algoritma DeepMind sebelumnya.

MuZero mampu bermain banyak permainan kompleks dengan lancar

Mencipta algoritma yang boleh menyesuaikan diri dengan setiap situasi dalam permainan tanpa latihan terlebih dahulu, sambil masih dapat memikirkan cara merancang untuk menguasai permainan itu adalah satu cabaran besar yang telah lama dicari oleh penyelidik AI untuk mencari penyelesaian. DeepMind cuba melakukan ini menggunakan kaedah yang dipanggil "Carian Pandang". Dengan teknik ini, algoritma AI akan mempertimbangkan situasi dan keadaan yang dijangkakan untuk membuat pelan tindakan.

Untuk memudahkan pemahaman, fikirkan permainan strategik seperti catur. Sebelum membuat keputusan atau langkah, anda perlu mempertimbangkan bagaimana lawan anda akan bertindak balas dan merancang dengan sewajarnya. Begitu juga, AI juga menggunakan kaedah Carian Lookahead untuk cuba merancang beberapa langkah lebih awal. Kemudian pilih dan utamakan gerakan yang mempunyai kemungkinan paling tinggi untuk membawa kepada kemenangan.

Masalah dengan pendekatan ini ialah kebanyakan situasi dunia sebenar (dan juga beberapa permainan) tidak mengandungi set peraturan mudah untuk mengawal cara ia beroperasi. Oleh itu, para penyelidik menyelesaikan masalah dengan meminta AI cuba memodelkan bagaimana permainan atau persekitaran senario tertentu akan mempengaruhi hasilnya. Kemudian, gunakan pengetahuan dan maklumat yang diperoleh untuk membuat perancangan. Had kaedah ini ialah memodelkan setiap aspek adalah hampir mustahil.

Oleh itu, daripada memodelkan segala-galanya, MuZero hanya akan cuba mempertimbangkan faktor penting untuk membuat keputusan, sama seperti manusia. Sebagai contoh, apabila kita melihat ke luar tingkap dan melihat awan gelap terbentuk di kejauhan, kebanyakan kita akan terfikir tentang hujan, ribut petir atau bagaimana kita harus berpakaian untuk mengelak daripada ditangkap. basah jika anda keluar... Daripada berfikir mengenai isu seperti pemeluwapan dan tekanan udara. Ia adalah satu bentuk pemikiran selektif naluri. Cara MuZero "berfikir" adalah sama.

Apabila membuat keputusan, MuZero mesti mengambil kira tiga faktor berbeza. Ia akan mempertimbangkan keputusan keputusan sebelumnya, keadaan semasa, dan akhirnya tindakan terbaik untuk mengambil keputusan seterusnya. Pendekatan yang kelihatan mudah ini menjadikan MuZero algoritma paling berkesan yang telah dicipta oleh DeepMind setakat ini.

AI baharu DeepMind boleh menguasai permainan yang kompleks tanpa latihan permainan terlebih dahulu

MuZero adalah salah satu algoritma yang paling cekap

Dalam ujian dalaman, keputusan menunjukkan bahawa MuZero menunjukkan prestasi yang sama dengan AlphaZero dalam catur, Go, dan shogi. Dan ia lebih baik daripada semua algoritma yang dikeluarkan sebelum ini, termasuk Agent57, dalam permainan Atari. Selain itu, lebih banyak masa yang diberikan oleh MuZero untuk mempertimbangkan sesuatu tindakan, lebih cekap algoritma itu.

Keupayaan pembelajaran automatik MuZero yang berkuasa suatu hari nanti boleh membantu menyelesaikan masalah kompleks dalam kebanyakan bidang "panas" hari ini, seperti robotik - di mana tiada tempat untuk peraturan. mudah.

Tinggalkan Komen

Pasukan petugas ChatGPT akan ditubuhkan oleh Eropah

Badan yang menyatukan pemerhati privasi negara Eropah berkata pada hari Khamis ia telah menubuhkan pasukan petugas khusus untuk ChatGPT

AI meramalkan masa kematian manusia dengan ketepatan 78%.

Para saintis Denmark dan Amerika telah bekerjasama untuk membangunkan sistem AI yang dipanggil life2vec, yang mampu meramalkan masa kematian manusia dengan ketepatan yang tinggi.

AI meramalkan penyakit kencing hanya dengan bunyi air kencing

Algoritma AI yang dipanggil Audioflow boleh mendengar bunyi kencing untuk mengenal pasti aliran tidak normal dan masalah kesihatan pesakit yang sepadan dengan berkesan dan berjaya.

Pelayan bar, berhati-hati: Robot ini boleh mencampurkan koktel dalam masa 1 minit sahaja

Penduduk Jepun yang semakin tua dan semakin berkurangan menyebabkan negara itu kekurangan sejumlah besar pekerja muda, terutamanya dalam sektor perkhidmatan.

Beratus-ratus orang kecewa apabila mereka mengetahui bahawa gadis yang mereka cintai adalah produk AI

Pengguna Reddit bernama u/LegalBeagle1966 ialah salah satu daripada ramai pengguna yang terpikat dengan Claudia, seorang gadis seperti bintang filem yang sering berkongsi swafoto yang menggoda, malah bogel. di platform ini.

12 lagi syarikat berpotensi menyertai AI alliance Microsoft.

Microsoft baru sahaja mengumumkan bahawa 12 lagi syarikat teknologi akan mengambil bahagian dalam program AI for Goodnya.

AI mencipta semula watak Dragon Ball dalam daging dan darah

Pengguna @mortecouille92 telah meletakkan kuasa alat reka bentuk grafik Midjourney untuk berfungsi dan mencipta versi unik realistik watak Dragon Ball yang terkenal seperti Goku, Vegeta, Bulma dan Kame yang lebih tua. .

7 teknik untuk meningkatkan respons ChatGPT

Hanya dengan menambah beberapa syarat atau menyediakan beberapa senario, ChatGPT boleh memberikan jawapan yang lebih berkaitan kepada pertanyaan anda. Mari lihat beberapa cara anda boleh meningkatkan kualiti respons ChatGPT anda.

Kagum dengan lukisan cantik yang dilukis oleh kecerdasan buatan

Midjourney ialah sistem kecerdasan buatan yang baru-baru ini menyebabkan "demam" dalam komuniti dalam talian dan dunia artis kerana lukisannya yang sangat cantik yang tidak kalah dengan lukisan artis sebenar.

Model AI ini adalah salah seorang pakar pertama yang menemui berita tentang wabak pneumonia Wuhan.

Beberapa hari selepas China mengumumkan wabak itu, dengan akses kepada data jualan tiket penerbangan global, sistem AI BlueDot terus meramalkan dengan tepat penyebaran virus Wuhan Corona ke Bangkok, Seoul, Taipei dan Tokyo.