サムスンのディープフェイクで闇の修道士ラスプーチンを本物に歌わせることができる

サムスンのディープフェイクで闇の修道士ラスプーチンを本物に歌わせることができる

英国ケンブリッジにあるサムスンの AI 研究センターの研究者とインペリアル カレッジ ロンドンのコンピューター サイエンスの専門家は、2D 画像の顔の動きをアニメーション化して完全に同期できる敵対的ネットワーク (GAN) を作成するプロジェクトに協力しました。人間の声を含むオーディオクリップを使用します。

この人工知能モデルは、唇と口の動きを同期させるだけでなく、眉毛の動きやまばたきを調整して、作成する顔をより自然に見せることもできます。ただし、最も重要な作業は、唇と口を発せられる音と同期させることです。現在、このステップはポスト編集中、またはコンピューター グラフィックスの使用を通じて行われることがよくあります。

サムスンのディープフェイクで闇の修道士ラスプーチンを本物に歌わせることができるサムスンAIセンター

研究者らは、このモデルを使用すると、最も自然な方法で漫画のキャラクターの話し顔を自動的に生成でき、低帯域幅のビデオ通話での視認性が向上し、口の同期や外国映画の吹き替えが向上すると考えています。

YouTube で共有されたこの研究の例の中で、最も印象的なのは、悪名高いロシアの神秘家ラスプーチン (1869 ~ 1919) が女性歌手の Halo アーティストのビヨンセの曲を「演奏」している様子を描いたビデオです。ラッパーの故2パックとビギーが自分たちの作品のカバーを歌ったり、偉大な科学者アルバート・アインシュタインが科学の共通言語についての引用を朗読したりするビデオなど、他のビデオも非常に注目に値します。

暗黒僧ラスプーチンが「Halo」という曲を演奏している

さらに、他にも興味深いビデオ例が多数あります。https: //sites.google.com/view/facial-animation/homeで参照できます。

上記の研究のニュースは、モスクワにある別のサムスン AI 研究センターが、モデルを使用せずに人工知能を使用して 2D アニメーションを作成するプロジェクトを導入してからわずか 1 か月後に発表されました。この技術を使用すると、より説得力のあるデジタル アバターやディープフェイク画像を作成できることが知られています。

画像やビデオなどのデジタル メディアを偽装するために GAN ネットワークを使用することは、近年、世界中の一般的な AI 分野で注目すべき傾向として浮上しています。今年の初めから現在まで、ICML、CVPR、その他多くの注目すべきイベントなどの人工知能カンファレンスの枠組みの中で、多くの洗練された GAN モデルが紹介されてきました。

サムスンのディープフェイクで闇の修道士ラスプーチンを本物に歌わせることができるラスプーチンと歌手のビヨンセのような人

その中でも、アプリケーションの可能性が非常に高い注目すべきモデルには、MS ペイント スタイルの落書きを芸術的な「傑作」に変えることができる Nvidia の GauGAN などがあります。または、CollaGEN は、韓国の研究者によって作成された、各画像内の欠落データ量を置き換える手法です。

ディープフェイクツールがさまざまな分野に貢献する可能性は非常に大きいですが、ディープフェイクツールがもたらす潜在的なリスクも科学者にとって頭の痛い問題です。

実際、このテクノロジーは、偽のビデオや、さらに悪いことにはポルノ映画で有名人 (俳優、歌手、モデルなど) になりすますために悪用されることがよくあります。多くの人がそれを真実だと信じていたため、このテクノロジーは強い衝撃を与えたことがわかります。これは、偽造される人の名誉と尊厳に影響を与えるだけでなく、世論を揺るがし、多くの論争やさらにひどい紛争を引き起こす原因になります。

サムスンのディープフェイクで闇の修道士ラスプーチンを本物に歌わせることができるディープフェイクには多くの潜在的なリスクが含まれています

おそらく将来的には、科学者と国家管理機関が協力して、この素晴らしいテクノロジーを地域社会のために適切かつ安全に使用するための規約を見つける必要があるでしょう。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。