AI 모델은 항공, 지상 데이터를 활용해 관찰하기 어려운 지역을 탐색한다.

AI 모델은 항공, 지상 데이터를 활용해 관찰하기 어려운 지역을 탐색한다.

인공지능 모델이 이전에 훈련된 적이 없거나 충분한 훈련 데이터가 제공되지 않은 영역(거리)을 탐색하는 데 도움이 될 수 있습니까? 딥마인드 인공지능 개발팀 과학자들이 우려하는 부분이 바로 이것이다. 그리고 수년간의 배양 끝에 과학자들은 최근 Arxiv.org에 게시된 기사에서 공개된 "거리 탐색을 위한 교차점 정책 학습"이라는 연구 프로젝트에서 마침내 성공을 거두었습니다.

이 연구에서 DeepMind 과학자들은 보다 최적의 관찰 효율성을 위해 도시의 다양한 영역을 대상으로 다양한 각도(주로 위에서 아래로 촬영한 이미지)의 풍부한 데이터 웨어하우스에서 훈련된 AI 정책 개발에 대해 설명합니다. 연구자들은 그러한 접근 방식이 더 나은 일반화 결과를 가져올 것이라고 믿습니다.

AI 모델은 항공, 지상 데이터를 활용해 관찰하기 어려운 지역을 탐색한다.

본질적으로 이 연구는 사람들이 그 도시의 지도를 여러 번 주의 깊게 살펴보면 사람들이 새로운 도시의 배치와 기본 구조에 빠르게 적응할 수 있다는 사실에서 영감을 얻었습니다.

“낯선 환경에서 시각적 관찰을 통해 탐색하는 능력은 AI 모델이 탐색을 학습하는 능력을 연구하는 핵심 구성 요소입니다. 훈련 데이터가 부족한 경우 거리를 탐색하는 AI 모델의 능력은 지금까지 상대적으로 제한적이었고, 시뮬레이션 모델에 의존하는 것은 장기적으로 효과적일 수 있는 솔루션이 아닙니다. 우리의 핵심 아이디어는 지상 뷰와 공중 뷰를 결합하고 뷰 간 전환을 가능하게 할 수 있는 공통 정책을 탐색하는 것입니다.”라고 연구팀 대표는 말했습니다.

보다 구체적으로, 연구자가 해야 할 첫 번째 단계는 탐색하려는 지역의 항공 지도를 수집하는 것입니다(지리적 좌표를 기반으로 한 거리 관찰 모드와 결합). 다음으로 그들은 데이터 훈련, 해당 지역의 공중 관측을 통한 소스 영역 조정, 지상 관측을 통한 목표 지역 이동으로 끝나는 3단계 순간이동 임무에 착수했다.

연구팀의 기계 학습 시스템에는 다음을 포함하는 3개의 별도 모듈 세트가 포함되어 있습니다.

  • 시각적 인식을 담당하는 컨벌루션 모듈입니다.
  • LSTM(장단기 기억) 모듈은 위치별 특성을 검색하는 역할을 담당합니다.
  • 정책 반복 신경 모듈은 작업을 통해 구분을 만드는 데 도움이 됩니다.

이 기계 학습 모델은 StreetLearn을 기반으로 구축된 다중 관점 야외 거리 환경인 StreetAir에 배포되었습니다. (StreetLearn은 Google 스트리트 뷰와 Google 지도에서 추출한 파노라마 사진을 모아 놓은 최초의 대화형 컬렉션입니다.)

AI 모델은 항공, 지상 데이터를 활용해 관찰하기 어려운 지역을 탐색한다.

StreetAir 및 StreetLearn에서는 뉴욕시(다운타운 NYC 및 미드타운 NYC 포함)와 피츠버그(Allegheny College 및 Carnegie Mellon University 캠퍼스)의 탁 트인 전망을 포함하는 항공 이미지가 각 위도 좌표 도 및 경도에서 환경이 항공 이미지를 반환하도록 배열됩니다. 84 x 84 크기의 이미지로 지상에서 촬영한 이미지와 동일한 크기입니다.

훈련을 받은 후 AI 시스템은 목적지의 경도와 위도 좌표가 포함된 파노라마 스트리트 뷰 이미지 차트를 현지화하고 탐색하는 방법을 학습하는 임무를 맡게 됩니다.

파노라마는 측면에서 2~5km, 약 10m 떨어진 영역을 다루며 (AI 제어) 차량은 회전당 5가지 작업 중 1개를 수행할 수 있습니다: 앞으로 이동, 왼쪽 또는 오른쪽으로 22.5도 회전 또는 왼쪽 또는 오른쪽으로 회전 67.5 도.

100~200m 이내의 목표 위치에 접근하면 이들 차량은 교차로를 빠르고 정확하게 식별하고 통과하도록 장려하는 '보상'을 받게 됩니다.

AI 모델은 항공, 지상 데이터를 활용해 관찰하기 어려운 지역을 탐색한다.

실험에서 새로운 환경에 적응하기 위해 항공 이미지를 활용한 차량은 1억 걸음에서 190, 2억 걸음에서 280의 보상 지표를 달성했습니다. 이는 지상 관찰 데이터만 사용하는 차량(1억 걸음에서 50, 200보에서 200)에 비해 두 가지 모두 상당히 높은 수치입니다. 백만 단계). 연구진에 따르면, 그 결과는 그들의 방법이 대상 도시의 여러 지역에 대한 지식을 보다 효과적으로 획득하는 차량의 능력을 크게 향상시키는 것으로 나타났습니다.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.