Nowa sztuczna inteligencja DeepMind może opanować złożone gry bez wcześniejszego szkolenia w zakresie rozgrywki

Nowa sztuczna inteligencja DeepMind może opanować złożone gry bez wcześniejszego szkolenia w zakresie rozgrywki

Platformy sztucznej inteligencji DeepMind stały się w ciągu ostatnich kilku lat sławne na całym świecie dzięki doskonałemu opanowaniu złożonych, „wykorzystujących mózg” gier, takich jak szachy, shogi i Go. Z biegiem czasu stopniowo „ewoluowały”, pokonując naszych graczy z krwi i kości zaawansowanymi technikami uczenia maszynowego.

W 2016 roku firma DeepMind wprowadziła AlphaGo, system sztucznej inteligencji o doskonałych możliwościach gier. Rok później firma kontynuowała wprowadzanie na rynek AlphaGo Zero. Jest to idealny następca AlphaGo, posiadający możliwość nauki gry w Go po prostu poprzez obserwację ludzkich meczów, a następnie opanowania gry, grając przeciwko sobie. Następnie jest AlphaZero, jeszcze lepszy system sztucznej inteligencji z możliwością jednoczesnej gry w Go, szachy i shogi za pomocą tylko jednego algorytmu.

Jednak wspólną cechą powyższych algorytmów AI jest to, że wszystkie muszą przejść dogłębne szkolenie w zakresie rozgrywki i zasad gry, aby móc opanować określoną grę. Jest to proces skomplikowany i stosunkowo czasochłonny.

Aby rozwiązać ten problem, firma DeepMind właśnie uruchomiła nowy, niezwykle zaawansowany system sztucznej inteligencji o nazwie MuZero. Ta sztuczna inteligencja potrafi płynnie grać w Go, szachy, shogi i zestaw gier Atari bez konieczności wcześniejszego przeszkolenia w zakresie powyższych zestawów zasad gier. Nauczy się wszystkiego sam, a następnie będzie mógł grać w te gry równie dobrze, a nawet lepiej niż którykolwiek z poprzednich algorytmów DeepMind.

Nowa sztuczna inteligencja DeepMind może opanować złożone gry bez wcześniejszego szkolenia w zakresie rozgrywki

MuZero jest w stanie płynnie grać w wiele skomplikowanych gier

Stworzenie algorytmu, który potrafi dostosować się do każdej sytuacji w grze bez wcześniejszego szkolenia, a jednocześnie jest w stanie wymyślić plan opanowania tej gry, to naprawdę duże wyzwanie, którego rozwiązania od dawna szukają deweloperzy, badacze sztucznej inteligencji. DeepMind próbował to zrobić za pomocą metody zwanej „Lookahead Search”. Dzięki tej technice algorytm AI uwzględni oczekiwane sytuacje i stany, aby stworzyć plan działania.

Aby ułatwić zrozumienie, pomyśl o grze strategicznej, takiej jak szachy. Przed podjęciem decyzji lub ruchu musisz rozważyć reakcję przeciwnika i odpowiednio zaplanować. Podobnie sztuczna inteligencja wykorzystuje również metodę Lookahead Search, aby spróbować zaplanować pewne ruchy z wyprzedzeniem. Następnie wybierz i ustal priorytety ruchów, które mają największe prawdopodobieństwo doprowadzenia do zwycięstwa.

Problem z tym podejściem polega na tym, że większość sytuacji w świecie rzeczywistym (a nawet niektóre gry) nie zawiera prostego zestawu reguł regulujących sposób ich działania. Naukowcy rozwiązali zatem problem, prosząc sztuczną inteligencję o modelowanie wpływu konkretnej gry lub środowiska scenariusza na wynik. Następnie wykorzystaj zdobytą wiedzę i informacje do stworzenia planu. Ograniczeniem tej metody jest to, że modelowanie każdego aspektu jest prawie niemożliwe.

Dlatego zamiast wszystko modelować, MuZero będzie próbował jedynie wziąć pod uwagę ważne czynniki przy podejmowaniu decyzji, podobnie jak ludzie. Na przykład, kiedy wyglądamy przez okno i widzimy w oddali ciemne chmury, większość z nas będzie wciągnięta w myśli o deszczu, burzach lub o tym, jak powinniśmy się ubierać, aby uniknąć złapania. Mokro, jeśli wyjdziesz na zewnątrz… Zamiast myśleć o kwestiach takich jak kondensacja i ciśnienie powietrza. Jest to forma instynktownego, selektywnego myślenia. Sposób, w jaki MuZero „myśli” jest taki sam.

Podejmując decyzję, MuZero musi wziąć pod uwagę trzy różne czynniki. Uwzględni wyniki poprzedniej decyzji, obecną sytuację i ostatecznie najlepszy sposób działania w celu podjęcia kolejnej decyzji. To pozornie proste podejście sprawia, że ​​MuZero jest najskuteczniejszym algorytmem, jaki DeepMind stworzył do tej pory.

Nowa sztuczna inteligencja DeepMind może opanować złożone gry bez wcześniejszego szkolenia w zakresie rozgrywki

MuZero jest jednym z najbardziej wydajnych algorytmów

Wyniki wewnętrznych testów wykazały, że MuZero radzi sobie podobnie jak AlphaZero w szachach, Go i Shogi. I jest lepszy niż wszystkie wcześniej wydane algorytmy, w tym Agent57, w grach Atari. Dodatkowo, im więcej czasu MuZero da na rozważenie akcji, tym skuteczniejszy będzie algorytm.

Potężne możliwości zautomatyzowanego uczenia się MuZero mogą pewnego dnia pomóc w rozwiązywaniu złożonych problemów w wielu dzisiejszych „gorących” dziedzinach, takich jak robotyka – gdzie nie ma miejsca na zasady. proste.


Europa utworzy grupę zadaniową ChatGPT

Europa utworzy grupę zadaniową ChatGPT

Organ zrzeszający krajowe organy nadzorujące prywatność w Europie poinformował w czwartek, że powołał grupę zadaniową zajmującą się ChatGPT

AI przewiduje czas śmierci człowieka z 78% dokładnością

AI przewiduje czas śmierci człowieka z 78% dokładnością

Duńscy i amerykańscy naukowcy współpracowali nad opracowaniem systemu sztucznej inteligencji o nazwie life2vec, zdolnego do przewidywania czasu śmierci człowieka z dużą dokładnością.

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Sztuczna inteligencja przewiduje choroby układu moczowego na podstawie dźwięku moczu

Algorytm sztucznej inteligencji o nazwie Audioflow może nasłuchiwać dźwięku oddawania moczu, aby skutecznie i skutecznie identyfikować nieprawidłowe wypływy moczu i powiązane z nimi problemy zdrowotne pacjenta.

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Barmani, uważajcie: ten robot może przygotować koktajl w zaledwie 1 minutę

Starzenie się i spadek liczby ludności Japonii spowodował, że w kraju brakuje znacznej liczby młodych pracowników, szczególnie w sektorze usług.

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Setki ludzi rozczarowało się, gdy dowiedziały się, że dziewczyna, którą kochają, jest wytworem sztucznej inteligencji

Użytkownik Reddita o imieniu u/LegalBeagle1966 jest jednym z wielu użytkowników zakochanych w Claudii, dziewczynie przypominającej gwiazdę filmową, która często udostępnia na tej platformie uwodzicielskie selfie, nawet nagie.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

12 kolejnych potencjalnych firm dołącza do „sojuszu AI” Microsoftu.

Microsoft właśnie ogłosił, że w jego programie AI for Good weźmie udział 12 kolejnych firm technologicznych.

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Sztuczna inteligencja odtwarza postacie Dragon Ball z krwi i kości

Użytkownik @mortecouille92 wykorzystał moc narzędzia do projektowania graficznego Midjourney i stworzył wyjątkowo realistyczne wersje słynnych postaci Dragon Ball, takich jak Goku, Vegeta, Bulma i starszy Kame. .

7 technik poprawy odpowiedzi ChatGPT

7 technik poprawy odpowiedzi ChatGPT

Po prostu dodając pewne warunki lub konfigurując pewne scenariusze, ChatGPT może udzielić bardziej trafnych odpowiedzi na Twoje zapytania. Przyjrzyjmy się sposobom poprawy jakości odpowiedzi ChatGPT.

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Podziwiaj piękne obrazy narysowane przez sztuczną inteligencję

Midjourney to system sztucznej inteligencji, który wywołał ostatnio „gorączkę” w społeczności internetowej i świecie artystów ze względu na niezwykle piękne obrazy, które nie ustępują tym, które tworzą prawdziwi artyści.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Ten model sztucznej inteligencji był jednym z pierwszych „ekspertów”, którzy odkryli wiadomości o wybuchu zapalenia płuc w Wuhan.

Kilka dni po ogłoszeniu przez Chiny wybuchu epidemii, mając dostęp do danych dotyczących globalnej sprzedaży biletów lotniczych, system sztucznej inteligencji BlueDot w dalszym ciągu dokładnie przewidywał rozprzestrzenianie się wirusa korona z Wuhan do Bangkoku, Seulu, Tajpej i Tokio.