Google の新しい AI モデル Autoflip は、あらゆる画面サイズに合わせてビデオをカスタマイズできます

Google の新しい AI モデル Autoflip は、あらゆる画面サイズに合わせてビデオをカスタマイズできます

確かに、モバイル デバイスでビデオを視聴するときに、ビデオの表示フレームが「ギザギザ」になる状況に多かれ少なかれ遭遇したことがあるでしょう。イライラやイライラはすぐに現れる感情かもしれませんが、それでも他に何もできないので、それを受け入れてビデオ全体を視聴する必要があります。

この一見小さな問題を解決するために、ユーザー エクスペリエンスに大きな影響を与える Google の AI 研究チームは、Autoflip と呼ばれるオープンソース ソリューションの開発に成功しました。これは、ビデオを自動的に微調整して、さまざまなデバイスや画面サイズに適応できるようにします。風景、正方形、ポートレートなどのモード。

Google の新しい AI モデル Autoflip は、あらゆる画面サイズに合わせてビデオをカスタマイズできます

基本的に、Autoflip は、シーン検出、ビデオ コンテンツ分析、そして最後に微調整という 3 つの主要な段階で機能します。

シーン検出段階では、機械学習モデルは、あるシーンから別のシーンにカットまたはジャンプする前の点に細心の注意を払います。このおかげで、あるフレームを前のフレームと比較して、色や関連要素の変化を検出できます。

Google の新しい AI モデル Autoflip は、あらゆる画面サイズに合わせてビデオをカスタマイズできます

ベンチマーク ショットを特定した後、AI モデルはビデオ コンテンツの分析に進み、シーン内の重要なオブジェクトを特定します。これを実現するために、Autoflip は深層学習ニューラル ネットワークを使用し、人、動物、車両、木など、シーンに現れるオブジェクトだけでなく、その動きや移動状態も明確に識別できるようにします。物体。

最終段階では、AI モデルは、単一空間で行われるシーンに静止モードを使用するか、対象のオブジェクトが常に移動している場合に追跡モードを使用するかを決定します。この要素と、ビデオを表示する必要があるターゲット サイズに基づいて、Autoflip は表示フレームをトリミングして滑らかさを確保し、特にすべての興味深いコンテンツを保持します。

Google の新しい AI モデル Autoflip は、あらゆる画面サイズに合わせてビデオをカスタマイズできます

Google AI 研究者らは、Autoflip を使用すると、人間の介入なしにビデオを複数のフォーマットや画面サイズに変換できると述べています。次の段階では、チームはインタビューや漫画の対象を追跡する Autoflip の機能を改善したいと考えています。これを行うには、前景と背景のオブジェクトをフレーム内に適切に配置するために、AI モデルにぼやけた画像とテキストの検出技術を装備する必要があります。

Autoflip のコードはここで参照できます。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。