마이크로소프트(MS)가 초대형 AI 모델 학습을 지원하는 새로운 딥러닝 라이브러리 딥스피드(DeepSpeed)를 발표했다.

마이크로소프트(MS)가 초대형 AI 모델 학습을 지원하는 새로운 딥러닝 라이브러리 딥스피드(DeepSpeed)를 발표했다.

Microsoft Research는 최근 최대 1,000억 개의 매개변수를 갖춘 거대한 AI 모델을 훈련하는 데 사용할 수 있는 딥 러닝 최적화 라이브러리인 DeepSpeed의 성공적인 개발을 발표하면서 인공 지능(AI) 연구 세계에 큰 파장을 일으켰습니다.

AI 훈련에서는 자연어 모델이 클수록 정확도가 높아집니다. 그러나 대규모 자연어 모델을 훈련하는 데는 많은 시간이 소요되고 관련 비용도 적지 않습니다. DeepSpeed는 위의 모든 어려움을 극복하기 위해 탄생했습니다: 속도, 비용, 훈련 규모 및 유용성을 향상시킵니다.

또한 Microsoft는 DeepSpeed에 모델에 필요한 리소스 양을 최소화하는 동시에 매개변수 수를 늘리는 데 도움이 되는 병렬 최적화 기술인 ZeRO(Zero Redundancy Optimizer)도 포함되어 있다고 언급했습니다. Microsoft 연구원들은 DeepSpeed와 ZeRO의 조합을 사용하여 170억 개의 매개변수를 갖춘 현재 최대 언어 모델인 새로운 Turing-NLG(Turing Natural Language Generation) 모델을 성공적으로 개발할 수 있었습니다.

마이크로소프트(MS)가 초대형 AI 모델 학습을 지원하는 새로운 딥러닝 라이브러리 '딥스피드(DeepSpeed)'를 발표했다.

DeepSpeed의 주요 특징:

  • 규모: OpenAI GPT-2, NVIDIA Megatron-LM 및 Google T5와 같은 현재 대규모 고급 AI 모델의 규모는 각각 15억, 83억, 110억 개의 매개변수입니다. DeepSpeed의 ZeRO 1단계는 Google 최대 모델보다 10배 더 큰 최대 1,000억 개의 매개변수로 모델을 실행할 수 있는 시스템 지원을 제공할 수 있습니다.
  • 속도: 기록된 처리량 증가는 하드웨어 구성에 따라 달라집니다. 낮은 대역폭 연결(NVIDIA NVLink 또는 Infiniband 제외)을 갖춘 NVIDIA GPU 클러스터에서 DeepSpeed는 15억 매개변수가 있는 표준 GPT-2 모델에 Megatron-LM을 단독으로 사용할 때보다 3.75배 향상된 처리량을 달성합니다. 고대역폭 연결을 갖춘 NVIDIA DGX-2 클러스터에서 200억~800억 개의 매개변수가 있는 모델의 경우 DeepSpeed는 3~5배 더 빠릅니다.
  • 비용: 속도 향상으로 인해 교육 비용도 크게 최적화됩니다. 예를 들어 DeepSpeed는 200억 개의 매개변수로 모델을 훈련하는 데 평소보다 3배 적은 리소스가 필요합니다.
  • 유용성: 현재 모델이 DeepSpeed ​​및 ZeRO를 사용하도록 전환하려면 몇 가지 사소한 코드 변경만 필요합니다. DeepSpeed는 코드 재설계나 모델 리팩토링이 필요하지 않습니다.

Microsoft는 GitHub 에서 DeepSpeed와 ZeRO를 모두 오픈소스화하고 있습니다 . 참고하세요.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.