AI モデルは航空および地上データを使用して、観察が困難なエリアに移動します

AI モデルは航空および地上データを使用して、観察が困難なエリアに移動します

人工知能モデルは、これまでトレーニングされたことがないエリア (通り) を移動したり、十分なトレーニング データが与えられなかったりするのに役立ちますか? それが、DeepMind 人工知能開発チームの科学者が懸念していることです。そして長年の研究を経て、科学者たちはついに「ストリート ナビゲーションのためのクロスビュー ポリシー学習」と呼ばれる研究プロジェクトで成功を収め、最近 Arxiv.org で公開された記事で明らかになりました。

この研究では、DeepMind の科学者は、より最適な観察効率を実現するために、都市のさまざまなエリアをターゲットにして、多くの角度 (主に上から下から撮影された画像) の豊富なデータ ウェアハウスからトレーニングされた AI ポリシーの開発について説明しています。研究者らは、そのようなアプローチがより良い一般化結果につながると信じています。

AI モデルは航空および地上データを使用して、観察が困難なエリアに移動します

本質的に、この研究は、人々が新しい都市の地図を何度も注意深く調べることで、その都市のレイアウトと基本構造にすぐに慣れることができるという事実に触発されています。

「不慣れな環境で視覚的な観察に基づいてナビゲーションする能力は、AI モデルのナビゲーション学習能力を研究する上で中心的な要素です。トレーニング データが不足している場合に AI モデルが道路を移動できる能力はこれまで比較的限られており、シミュレーション モデルに依存することは長期的には効果的なソリューションではありません。私たちの中心的なアイデアは、地上ビューと上空ビューを組み合わせて、ビュー間の切り替えを可能にする共通のポリシーを検討することです」と研究チームの代表者は述べています。

より具体的には、研究者がしなければならない最初のステップは、(地理座標に基づく街頭観察モードと組み合わせて)ナビゲートする予定のエリアの航空地図を収集することです。これに対応する理由)。次に、彼らは 3 部構成のテレポーテーション ミッションに着手しました。まず、データのトレーニングと、地域の航空観測を使用したソース エリアの調整から始まり、地上観測を使用したターゲット エリアへの移動で終わります。

研究チームの機械学習システムには、次の 3 つの個別のモジュールのセットが含まれています。

  • 畳み込みモジュール。視覚を担当します。
  • 長短期記憶 (LSTM) モジュールは、場所固有の特性を取得する役割を果たします。
  • ポリシー反復ニューラル モジュールは、アクションを通じて部門を作成するのに役立ちます。

この機械学習モデルは、StreetLearn 上に構築された、多視点の屋外ストリート環境である StreetAir にデプロイされました。(StreetLearn は、Google ストリート ビューと Google マップから抽出されたパノラマ写真のインタラクティブなコレクションです)。

AI モデルは航空および地上データを使用して、観察が困難なエリアに移動します

StreetAir と StreetLearn では、ニューヨーク市 (ニューヨーク市のダウンタウンとニューヨーク市ミッドタウンを含む) とピッツバーグ (アレゲニー大学とカーネギー メロン大学のキャンパス) のパノラマ ビューを含む航空画像が、各緯度座標度および経度で環境が航空写真を返すように配置されます。地上からの画像と同じサイズの 84 x 84 の画像。

AI システムは、トレーニングを受けた後、目的地の経度と緯度の座標を含むパノラマ ストリート ビュー画像チャートを位置特定してナビゲートする方法を学習する任務を負います。

パノラマは一辺 2 ~ 5 km、約 10 メートル離れたエリアをカバーしており、(AI 制御の) 車両は 1 ターンにつき 5 つのアクションのうち 1 つを実行できます: 前進、左または右に 22.5 度回転、または左または右に 67.5 度回転度。

目標位置に 100 ~ 200 メートル以内に近づくと、これらの車両は交差点を迅速かつ正確に識別して通過することを促す「報酬」を受け取ります。

AI モデルは航空および地上データを使用して、観察が困難なエリアに移動します

実験では、航空画像を利用して新しい環境に適応した車両は、1 億歩で 190、2 億歩で 280 という報酬指標を達成しました。これは、地上観測データのみを使用した車両 (1 億歩で 50、200 万歩で 200) と比較して、どちらも大幅に高かったです。百万歩)。研究者らによると、その結果、彼らの方法により、対象都市の複数のエリアに関する知識をより効果的に取得する車両の能力が大幅に向上することが示されました。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。