DeepMind의 새로운 AI는 사전 게임 플레이 훈련 없이도 복잡한 게임을 마스터할 수 있습니다.

DeepMind의 새로운 AI는 사전 게임 플레이 훈련 없이도 복잡한 게임을 마스터할 수 있습니다.

딥마인드의 인공지능 플랫폼은 체스, 장기, 바둑 등 복잡하고 '뇌 집약적인' 게임에 대한 탁월한 숙달 덕분에 지난 몇 년 동안 전 세계적으로 유명해졌습니다. 시간이 지남에 따라 그들은 점차적으로 "진화"하여 고급 기계 학습 기술로 우리의 육혈 게이머를 물리쳤습니다.

2016년 딥마인드는 뛰어난 게임 능력을 갖춘 AI 시스템인 알파고(AlphaGo)를 선보였습니다. 1년 후에도 회사는 계속해서 AlphaGo Zero를 출시했습니다. 이것은 AlphaGo의 완벽한 후속작으로, 인간의 시합을 관찰하는 것만으로 바둑을 배우고, 자신과 대결하여 게임을 마스터할 수 있는 능력을 보유하고 있습니다. 그리고 단 하나의 알고리즘으로 바둑, 체스, 장기를 동시에 플레이할 수 있는 훨씬 더 우수한 AI 시스템인 AlphaZero가 있습니다.

그러나 위 AI 알고리즘의 공통점은 특정 게임을 마스터하려면 게임 플레이는 물론 게임 규칙에 대해서도 심도 있는 교육을 받아야 한다는 것입니다. 이는 복잡하고 상대적으로 시간이 많이 걸리는 프로세스입니다.

이 문제를 해결하기 위해 DeepMind는 MuZero라는 매우 뛰어난 새로운 AI 시스템을 출시했습니다. 이 AI는 위 게임의 규칙 세트에 대해 사전 교육을 받지 않고도 바둑, 체스, 장기 및 일련의 Atari 게임을 유창하게 플레이할 수 있습니다. 모든 것을 스스로 학습하고 DeepMind의 이전 알고리즘과 동일하거나 그보다 더 나은 게임을 플레이할 수 있습니다.

DeepMind의 새로운 AI는 사전 게임 플레이 훈련 없이도 복잡한 게임을 마스터할 수 있습니다.

MuZero는 많은 복잡한 게임을 유창하게 플레이할 수 있습니다.

사전 교육 없이도 게임의 모든 상황에 적응할 수 있는 알고리즘을 만드는 동시에 해당 게임을 마스터하기 위한 계획을 세우는 것은 개발자 AI 연구원들이 오랫동안 솔루션을 찾고 있던 큰 과제입니다. DeepMind는 "Lookahead Search"라는 방법을 사용하여 이를 수행하려고 했습니다. 이 기술을 통해 AI 알고리즘은 예상되는 상황과 상태를 고려하여 행동 계획을 수립합니다.

이해하기 쉽도록 체스와 같은 전략 게임을 생각해 보세요. 결정을 내리거나 움직이기 전에 상대방이 어떻게 반응할지 고려하고 그에 따라 계획을 세워야 합니다. 마찬가지로 AI도 미리 탐색(Lookahead Search) 방법을 사용하여 일부 동작을 미리 계획하려고 합니다. 그런 다음 승리로 이어질 가능성이 가장 높은 동작을 선택하고 우선순위를 지정하세요.

이 접근 방식의 문제점은 대부분의 실제 상황(및 일부 게임)에는 작동 방식을 제어하는 ​​간단한 규칙 세트가 포함되어 있지 않다는 것입니다. 그래서 연구진은 AI가 특정 게임이나 시나리오 환경이 결과에 어떤 영향을 미칠지 모델링하도록 하여 문제를 해결했습니다. 그런 다음 얻은 지식과 정보를 활용하여 계획을 세우십시오. 이 방법의 한계는 모든 측면을 모델링하는 것이 거의 불가능하다는 것입니다.

따라서 MuZero는 모든 것을 모델링하는 대신 인간과 마찬가지로 중요한 요소만 고려하여 결정을 내리려고 노력할 것입니다. 예를 들어, 창밖을 내다보면 멀리 먹구름이 형성되는 것을 보면 대부분의 사람들은 비, 천둥번개, 들키지 않으려면 어떻게 옷을 입어야 하는지, 밖에 나가면 젖을까… 응축 및 기압과 같은 문제에 대해. 이는 본능적이고 선택적인 사고의 한 형태입니다. MuZero가 "생각하는" 방식은 동일합니다.

결정을 내릴 때 MuZero는 세 가지 다른 요소를 고려해야 합니다. 이전 결정의 결과, 현재 상황, 최종적으로 다음 결정을 내리기 위한 최선의 조치를 고려합니다. 이렇게 간단해 보이는 접근 방식은 MuZero를 DeepMind가 지금까지 만든 가장 효과적인 알고리즘으로 만듭니다.

DeepMind의 새로운 AI는 사전 게임 플레이 훈련 없이도 복잡한 게임을 마스터할 수 있습니다.

MuZero는 가장 효율적인 알고리즘 중 하나입니다.

내부 테스트 결과 MuZero는 체스, 바둑, 장기에서 AlphaZero와 유사한 성능을 발휘하는 것으로 나타났습니다. 그리고 이는 Atari 게임에서 Agent57을 포함하여 이전에 출시된 모든 알고리즘보다 우수합니다. 또한 MuZero가 작업을 고려하는 데 더 많은 시간을 제공할수록 알고리즘이 더 효율적이 됩니다.

MuZero의 강력하고 자동화된 학습 기능은 언젠가 로봇 공학과 같이 규칙이 존재할 수 없는 오늘날의 "인기" 분야에서 복잡한 문제를 해결하는 데 도움이 될 수 있습니다.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.