マイクロソフトの AI は人の声を模倣するのに 3 秒かかる

マイクロソフトの AI は人の声を模倣するのに 3 秒かかる

Microsoft が作成した AI である Vall-E は、実際の人の声を 3 秒間聞くことで、その人の口調や話し方を模倣することができますが、それでもロボットの声のように聞こえます。

マイクロソフトの AI は人の声を模倣するのに 3 秒かかる

マイクロソフトのAI Val-E。イラスト写真:VallE-Demo.

Microsoft のこの AI システムは「ニューラル コーデック言語モデル」と呼ばれます。コーデックは、アルゴリズムを使用してビデオを処理し、バイト ストリームに保存するツールです。オーディオ ファイルまたはビデオ ファイルは、さまざまな目的のために縮小され、解凍されます。

Vall-E は、2022 年に Meta によって開発された機械学習技術を使用したオーディオ コーデックである EnCodec プラットフォーム上で Microsoft によって構築されました。Vall-E は、各人の音声をキャプチャして分析することで独自の音声コーデックを作成し、その情報は EnCodec を通じて「トークン」と呼ばれる部分に分割されます。これは、通常は波形で行われる以前のテキスト読み上げ方式とは異なります。

次に、Vall-E はトレーニング データを使用して、音声のイントネーションについて「知っている」内容と一致させるため、「学習した」内容に応じて他のフレーズを言うことができます。

この音声模倣プロセス全体は 3 秒で完了します。これは、今日の言語模倣 AI システムによってこれまでに達成されたことはありません。

Microsoft は、7,000 人以上からの 60,000 時間分の英語を収録したライブラリを Vall-E のトレーニングに使用しています。このライブラリは、時間の経過とともにさらに多くの言語で追加される予定です。

MicrosoftはVall-Eが高品質の音声合成ソフトウェアに適用されることを期待している。

しかし、Vall-E は悪意のある目的に使用される可能性があると専門家を心配させています。この AI は、悪者が詐欺や恐喝を目的として音声を偽装するために使用される可能性があります。この AI がディープフェイク動画と組み合わされると、危険性のレベルは何倍にもなる可能性があります。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。