Google、世界中の20万か所のランドマークの500万枚以上の写真を収録した巨大なAIトレーニングデータウェアハウスをリリース

Google、世界中の20万か所のランドマークの500万枚以上の写真を収録した巨大なAIトレーニングデータウェアハウスをリリース

世界の各場所の特徴を個人レベルで正確に認識できる (つまり、同じカテゴリの場所を明確に区別できる、たとえば、ナイアガラの滝と他の滝を明確に区別できる) および画像検索 (画像内のオブジェクト) が可能な AI システムを設計する各カテゴリのそのオブジェクトの他のバージョンとの統合) は知的研究部門の長年の目標の 1 つであり、Google の人工知能は特に興味深いものです。昨年、同社は、当時世界最大だとGoogleが主張していた地球のランドマークに関連するデータパッケージであるGoogle-Landmarksをリリースし、また2つのコンペティション(Landmark Recognition 2018とLandmark Retriny 2018)を主催し、2018年以上の参加を集めた。世界の主要な機械学習と人工知能の研究者 500 人。

Google、世界中の20万か所のランドマークの500万枚以上の写真を収録した巨大なAIトレーニングデータウェアハウスをリリース

昨年の成功に続き、昨日 5 月 5 日、Google は、新しいテクノロジーの開発を成功させるための計画における重要なステップとして、オープン ソース コードを含む Google-Landmarks-v2 AI トレーニング データ ウェアハウスを正式にリリースしました。コンピューター ビジョン モデルは、世界中のランドマークをさらに認識できるようになります。素早く、正確に、そして洗練された形で。この Google-Landmarks-v2 データ ウェアハウスは、以前のバージョンよりも規模が大幅に大きくなり、世界中の 200,000 か所のランドマーク (以前のバージョンの 7 倍) の最大 500 万枚 (以前のバージョンの 2 倍) の写真を保有しています。世界中で。

さらに、Google は今年、Landmark Recognition 2019 と Landmark Retriny 2019 という 2 つの新しい「チャレンジ」を Kaggle 機械学習コミュニティで開始することを忘れず、同時に Detect-to-Retrieve のソース コードとモデルをリリースしました。フレームワークは、領域ごとにイメージをより効果的に復元するのに役立ちます。

Google、世界中の20万か所のランドマークの500万枚以上の写真を収録した巨大なAIトレーニングデータウェアハウスをリリース

「画像認識と検索の両方の方法では、一般に、システムをより効果的にトレーニングし、より強力にするために、画像の数とランドマークの多様性の両方の点で、より大きなトレーニング データセットが必要になります。「私たちは、このデータセットが最新の AI モデルの画像認識と検索機能をより徹底的に改善するのに役立つことを願っています」と Google AI チームの 2 人のソフトウェア エンジニア、Bingyi Cao 氏と Tobias 氏は述べました。

さらに、これら 2 人の専門家によると、Google-Landmarks-v2 に保存されている 20 万以上のランドマークの 500 万枚の写真が世界中の写真家から収集され提供されています。各写真には、ノイシュヴァンシュタイン城、ゴールデン ゲート ブリッジ、清水寺、ブルジュ ハリファ、ギザ スフィンクス (ギザの大スフィンクス)、マチュ ピチュ、その他多くの有名な観光スポットなど、場所と作者の具体的な説明がラベル付けされます。その後、Google の研究者は、ウィキメディア財団の画像、音声などのオンライン アーカイブであるウィキメディア コモンズから収集した歴史的であまり知られていない写真を追加しました。

Google、世界中の20万か所のランドマークの500万枚以上の写真を収録した巨大なAIトレーニングデータウェアハウスをリリース

それでは、Detect-to-Retrieve フレームワークが解決する主な問題は何でしょうか? Bingyi Cao 氏と Tobias Weyand 氏が説明したように、Google がリリースしたモデル (最初の Google-Landmarks データセットからの 80,000 枚の画像のサブセットでトレーニングされた) では、境界ボックスを利用できます。興味深いアイテムが含まれているため、精度が大幅に向上します。

また、Landmark Recognition 2019(参加チームはランドマークの識別を支援するAIモデルの設計を課題とします)とLandmark Retriny 2019(参加チームはAIシステムを利用して指定された場所を正確に表示するための画像を検索します)も本日より参加登録の受付を開始しました。どちらのコンテストにも総額 50,000 ドルの賞金が含まれており、優勝チームは、今年後半にカリフォルニア州ロングビーチで開催されるコンピューター ビジョンとパターン認識に関する会議 (コンピューター ビジョンとパターン認識に関する会議) に Google から招待され、ショーを披露します。彼らが実装したアプローチの詳細。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。