Microsoft、超大規模AIモデルの学習を支援できる新しい深層学習ライブラリ「DeepSpeed」を発表

Microsoft、超大規模AIモデルの学習を支援できる新しい深層学習ライブラリ「DeepSpeed」を発表

Microsoft Research は最近、最大 1,000 億のパラメータを持つ巨大な AI モデルのトレーニングに使用できる深層学習最適化ライブラリである DeepSpeed の開発に成功したと発表し、人工知能 (AI) 研究界に波紋を巻き起こしました。

AI トレーニングでは、自然言語モデルが大きいほど精度が高くなります。ただし、大規模な自然言語モデルのトレーニングには多くの時間がかかり、それに伴うコストも小さくありません。DeepSpeed は、速度、コスト、トレーニングの規模、使いやすさの向上という上記のすべての課題を克服するために生まれました。

さらに、Microsoftは、DeepSpeedにはパラメータ数の増加を支援しながら、モデルに必要なリソースの量を最小限に抑えるのに役立つ並列最適化手法であるZeRO(Zero Redundancy Optimizer)も含まれていることにも言及しました。DeepSpeed と ZeRO を組み合わせて使用​​することで、マイクロソフトの研究者は、170 億のパラメーターを備えた今日最大の言語モデルである新しいチューリング自然言語生成 (Turing-NLG) モデルの開発に成功しました。

Microsoft、超大規模AIモデルの学習を支援できる新しい深層学習ライブラリ「DeepSpeed」を発表

DeepSpeed のハイライト:

  • スケール: OpenAI GPT-2、NVIDIA Megatron-LM、Google T5 などの現在の大規模で高度な AI モデルのスケールは、それぞれ 15 億、83 億、110 億のパラメーターです。DeepSpeed の ZeRO ステージ 1 は、Google の最大のモデルの 10 倍である最大 1,000 億のパラメータを持つモデルを実行するためのシステム サポートを提供できます。
  • 速度:記録されるスループットの増加はハードウェア構成によって異なります。低帯域幅接続の NVIDIA GPU クラスター (NVIDIA NVLink または Infiniband なし) では、DeepSpeed は、15 億パラメーターを持つ標準 GPT-2 モデルに対して Megatron-LM のみを使用した場合と比較して、3.75 倍のスループット向上を達成します。高帯域幅接続を備えた NVIDIA DGX-2 クラスターでは、200 ~ 800 億のパラメーターを持つモデルの場合、DeepSpeed は 3 ~ 5 倍高速になります。
  • コスト:速度の向上により、トレーニング コストも大幅に最適化されます。たとえば、200 億のパラメーターを使用してモデルをトレーニングする場合、DeepSpeed で必要なリソースは通常の 3 分の 1 です。
  • 使いやすさ:現在のモデルで DeepSpeed と ZeRO の使用に切り替えるには、コードをわずかに変更するだけで済みます。DeepSpeed では、コードの再設計やモデルのリファクタリングは必要ありません。

MicrosoftはDeepSpeedとZeROの両方をGitHubでオープンソース化していますので、参照してください。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。