Google araştırmacıları yapay zekanın pekiştirmeli öğrenmeyi geliştirmek için oyun oynamasına izin veriyor

Google araştırmacıları yapay zekanın pekiştirmeli öğrenmeyi geliştirmek için oyun oynamasına izin veriyor

Makine öğreniminin bir alt alanı olan takviye öğrenimi, yazılım politikasını özellikle hedeflenen hedeflere yönlendirmek için "ödülleri" kullanan yapay zeka eğitim tekniklerini içerir. Başka bir deyişle bu, yapay zekanın farklı eylemleri deneyeceği, her yanıttan o eylemin daha iyi sonuçlar getirip getirmediğini öğreneceği ve ardından işe yarayan eylemleri güçlendireceği bir süreçtir. en iyi sonuçları verir. Son zamanlarda, sosyal kuralların etkisini modellemek, son derece iyi oyun yeteneklerine sahip yapay zeka modelleri veya kendi kendini iyileştirebilen programlanabilir robotlar oluşturmak için takviyeli öğrenmeden yararlanılıyor.

Google araştırmacıları yapay zekanın pekiştirmeli öğrenmeyi geliştirmek için oyun oynamasına izin veriyor

Pek çok farklı model ve amaçta uygulanabilen, yüksek esnekliğe sahip olmasına rağmen pekiştirmeli öğrenme tekniğinin talihsiz bir eksikliği vardır: Etkisizdir. Takviyeli öğrenme tekniklerini kullanarak bir yapay zeka modelini eğitmek, simüle edilmiş veya gerçek dünya ortamında birçok farklı etkileşim gerektirir; bu, bir insanın belirli bir görevi öğrenmesi gerektiğinden çok daha fazladır. Özellikle video oyunları alanında bu sorunun kısmen üstesinden gelmek için, Google'daki yapay zeka araştırmacıları yakın zamanda, eylem seçiminde kalite politikalarını öğrenmek ve geliştirmek için basit video oyunu modellerini kullanan Simulated Policy Learning (SimPLe olarak kısaltılır) adı verilen yeni bir algoritmanın kullanılmasını önerdi. takviyeli öğrenme teknikleri.

Araştırmacılar algoritmayı, "Atari için Model Tabanlı Güçlendirme Öğrenme" başlıklı yeni yayınlanan bir makalede ve ayrıca açık kaynak koduna eşlik eden bir belgede açıkladılar.

“Yüksek düzeyde, SimPLe algoritmasını geliştirirken araştırmacıların fikri, oyunun özelliklerine ilişkin bir model oluşturmak ve bu modeli, bir oyun simülasyonu ortamında bir politikayı optimize etmek (modelsiz takviyeli öğrenme teknikleriyle) için kullanmak arasında geçiş yapmaktı. Bu algoritmanın arkasındaki temel prensipler iyi kurulmuş ve birçok yeni model tabanlı takviyeli öğrenme yönteminde kullanılıyor," diye paylaştı Google AI ekibi bilim adamları Łukasz Kaiser ve Dumitru Erhan.

İki araştırmacının açıkladığı gibi, bir oyun oynamak için bir yapay zeka sistemini eğitmek, hedef oyunun bir dizi kare ve komut kombinasyonu (örneğin “sol”, “iç”, “sağ”, “) tarafından verilen bir sonraki kare dokularını tahmin etmeyi gerektirir. ileri”, “geriye”). Buna ek olarak araştırmacılar, başarılı bir modelin, oyun aracısı program politikalarının eğitiminde kullanılabilecek "yörüngeler" oluşturabileceğini ve bunun da oyundaki karmaşık hesaplama dizilerine güvenme ihtiyacını azaltacağını gösterdi.

Google araştırmacıları yapay zekanın pekiştirmeli öğrenmeyi geliştirmek için oyun oynamasına izin veriyor

SimPLe algoritması tam olarak bunu yapar. Ödüllü bir sonraki kareyi tahmin etmek için girdi olarak 4 kare gerekir ve bir kez tamamen eğitildikten sonra algoritma, politikayı geliştirmek için kullanılan "kullanıma sunumlar" (örnek eylem dizileri, gözlemler ve sonuçlar) üretir (Kaiser ve Erhan, SimPLe algoritmasının tahmin hatasını en aza indirmek için yalnızca ortalama uzunluktaki sunumları kullanır).

2 saatlik oyuna (100.000 etkileşim) eşdeğer süren testlerde, SimPLe'nin ayarlanmış politikalarına sahip temsilciler iki test oyununda (Pong ve Freeway) maksimum puanlara ulaşırken aynı zamanda geleceğe yönelik 50 adıma kadar mükemmele yakın tahminler ürettiler.

Google araştırmacıları yapay zekanın pekiştirmeli öğrenmeyi geliştirmek için oyun oynamasına izin veriyor

Bazen iki araştırmacı da oyunlarda küçük ama oldukça alakalı ayrıntıları toplamaya çalıştı ve bu da başarısızlıkla sonuçlandı. Kaiser ve Erhan, bu algoritmanın hala standart takviyeli öğrenme yöntemlerinin performansına tam olarak uymadığını itiraf ediyor. Ancak SimPLe, eğitim açısından iki kattan fazla etkili olabilir ve ekip, gelecekteki çalışmaların algoritmanın performansını önemli ölçüde artırmaya yardımcı olacağını umuyor.

"Model tabanlı takviyeli öğrenme yöntemlerinin ana hedefi, örneğin birçok robotik görevde olduğu gibi etkileşimlerin karmaşık, yavaş olduğu veya insan etiketlemesi gerektirdiği ortamlardır. Böyle bir ortamda, bir simülatör aracı programların ortamını daha iyi anlamamıza olanak tanıyacak ve bunun sonucunda işleri yapmanın yeni, daha iyi ve daha hızlı yollarına yol açabilecektir. Çok görevli takviyeli öğrenme”.


ChatGPT görev gücü Avrupa tarafından oluşturulacak

ChatGPT görev gücü Avrupa tarafından oluşturulacak

Avrupa'nın ulusal gizlilik gözlemcilerini birleştiren organ Perşembe günü yaptığı açıklamada, ChatGPT'ye adanmış bir görev gücü kurduğunu söyledi.

Yapay zeka, insanın ölüm zamanını %78 doğrulukla tahmin ediyor

Yapay zeka, insanın ölüm zamanını %78 doğrulukla tahmin ediyor

Danimarkalı ve Amerikalı bilim insanları, insanın ölüm zamanını yüksek doğrulukla tahmin edebilen, life2vec adı verilen bir yapay zeka sistemi geliştirmek için iş birliği yaptı.

Yapay Zeka sadece idrar sesine bakarak idrar yolu hastalıklarını tahmin ediyor

Yapay Zeka sadece idrar sesine bakarak idrar yolu hastalıklarını tahmin ediyor

Audioflow adı verilen bir yapay zeka algoritması, hastanın anormal akışlarını ve buna karşılık gelen sağlık sorunlarını etkili ve başarılı bir şekilde tanımlamak için idrara çıkma sesini dinleyebilir.

Barmenler dikkat: Bu robot bir kokteyli sadece 1 dakikada hazırlayabiliyor

Barmenler dikkat: Bu robot bir kokteyli sadece 1 dakikada hazırlayabiliyor

Japonya'nın yaşlanan ve azalan nüfusu, ülkenin özellikle hizmet sektöründe önemli sayıda genç işçiden yoksun kalmasına neden oldu.

Yüzlerce kişi sevdikleri kızın yapay zekanın bir ürünü olduğunu öğrenince hayal kırıklığına uğradı

Yüzlerce kişi sevdikleri kızın yapay zekanın bir ürünü olduğunu öğrenince hayal kırıklığına uğradı

u/LegalBeagle1966 adlı bir Reddit kullanıcısı, bu platformda sıklıkla baştan çıkarıcı, hatta çıplak selfieler paylaşan film yıldızı benzeri Claudia'ya aşık olan birçok kullanıcıdan biri.

Microsoftun AI ittifakına 12 potansiyel şirket daha katılıyor.

Microsoftun AI ittifakına 12 potansiyel şirket daha katılıyor.

Microsoft, AI for Good programına 12 teknoloji şirketinin daha katılacağını duyurdu.

Yapay zeka, Dragon Ball karakterlerini etten kemikten yeniden yaratıyor

Yapay zeka, Dragon Ball karakterlerini etten kemikten yeniden yaratıyor

Kullanıcı @mortecouille92, grafik tasarım aracı Midjourney'in gücünden yararlandı ve Goku, Vegeta, Bulma ve Elder Kame gibi ünlü Dragon Ball karakterlerinin benzersiz gerçekçi versiyonlarını yarattı.

ChatGPT yanıtlarını iyileştirmek için 7 teknik

ChatGPT yanıtlarını iyileştirmek için 7 teknik

ChatGPT, yalnızca bazı koşullar ekleyerek veya bazı senaryolar oluşturarak sorularınıza daha alakalı yanıtlar verebilir. ChatGPT yanıtlarınızın kalitesini artırabileceğiniz bazı yollara bakalım.

Yapay zekanın çizdiği güzel tablolara hayran kalın

Yapay zekanın çizdiği güzel tablolara hayran kalın

Midjourney, gerçek sanatçılarınkinden aşağı olmayan son derece güzel tabloları nedeniyle son zamanlarda çevrimiçi toplulukta ve sanatçı dünyasında "ateşe" neden olan bir yapay zeka sistemidir.

Bu yapay zeka modeli, Wuhan zatürresinin patlak vermesiyle ilgili haberleri keşfeden ilk uzmanlardan biriydi.

Bu yapay zeka modeli, Wuhan zatürresinin patlak vermesiyle ilgili haberleri keşfeden ilk uzmanlardan biriydi.

Çin'in salgını duyurmasından günler sonra, küresel uçak bileti satış verilerine erişim sağlayan BlueDot'un yapay zeka sistemi, Wuhan Corona virüsünün Bangkok, Seul, Taipei ve Tokyo'ya yayılmasını doğru bir şekilde tahmin etmeye devam etti.