Amazon の AI システムにより、Alexa での音声認識エラーが 15% 削減されました。

Amazon の AI システムにより、Alexa での音声認識エラーが 15% 削減されました。

数か月前、Amazon は、ユーザーが特定の TV モデルやインターネット広告、ラジオ広告で仮想アシスタントを起動したときに、Alexa が正確な応答を返せないという多くの問題について詳しく説明しました。結局のところ、ここでの主な問題は、Amazon の音声アシスタントが環境からの背景ノイズをどのように効果的に除去して、より正確なフィードバックをユーザーに提供できるかということです。最近、Amazon のエンジニアは、エンドツーエンドのアンカー音声認識と呼ばれるブログ投稿とそれに付随する研究論文で、Alexa の音声認識とコマンドを 15% 向上させるのに役立つ、人工知能に基づく新しいノイズ分離技術を具体的に紹介しました。このシステムがどのように動作するかについてのより詳細な情報は、今年後半にブライトンで開催される音響、音声、信号処理に関する国際会議で発表される予定です。

Amazon の AI システムにより、Alexa での音声認識エラーが 15% 削減されました。

「実際、私たちは常に、Alexa に意図されていないコマンドを「無視する」方法、つまり、周囲の環境から発せられる無数のノイズの中からコマンドを選択する方法を教えることで、Alexa のパフォーマンスを向上させようと努めています。そのためには、スピーカーが特定のウェイクワード (通常は「アレクサ」) を言うことによって Alexa 対応デバイスを起動すると仮定します。これは、仮想アシスタントが外部からの音の混乱の中で分離して識別する必要があるキーワードです。環境。基本的に、私たちの技術は、ウェイク ワードである可能性のある音 (通常はイントネーションまたは音素の類似性に基づいて) をすばやく「キャプチャ」し、文を正確に識別するための基準であるウェイク ワードと比較するのに役立ちます。そうすれば、要素が標準的なウェイクワードに最もよく一致する文がアレクサによってコマンドとして理解され、他の文は背景ノイズとみなされます」とこのプロジェクトを担当する科学者チームのリーダー、シン・ファン氏は述べた。 AIが解説してくれる。

Xin Fanらは、背景雑音とウェイクワードを区別するために別のAIシステムをトレーニングする代わりに、単語マッチングメカニズムをインテリジェンスベースの音声認識モデルと統合した。科学者らは、デコーダーの AI アーキテクチャの 2 つのバリエーションを順番にテストしました。つまり、入力データ (オーディオ信号のミリ秒単位のスナップショット) を処理して、対応する出力シーケンス (サウンドの音素レンダリング) を生成するアーキテクチャを使用しました。 、ほとんどの従来のエンコーダ/デコード技術と同様に、エンコード コンポーネントは入力データをベクトル固定長 (数値の文字列) として要約し、それを出力データに変換します。一方、周囲の環境から 1 つ以上の音声文字列に含まれるウェイク ワードの基本的な特徴を検出するように「訓練」された特別な注意メカニズムが、セットを「ガイド」する役割を果たします。デコードでは、ベクトル内のそれらの特徴により多くの注意が払われます。

Amazon の AI システムにより、Alexa での音声認識エラーが 15% 削減されました。

実験では、研究者らは、まず単語の音を直接比較するコンポーネントを追加することで、単語の発音認識に重点を置くように AI モデルの 1 つをトレーニングし、ウェイクワードをさまざまな発音と比較し、その結果得られたデータを別の別のデータへの入力として使用しました。エンコード ベクトルのビットを圧縮するようにトレーニングされたコンポーネント。結果は興味深いもので、このモデルではエラー率が 15% から 13% に減少しました。


ChatGPTタスクフォースはヨーロッパによって設立されます

ChatGPTタスクフォースはヨーロッパによって設立されます

欧州の国家プライバシー監視団体を統合する団体は木曜日、ChatGPT専用の対策委員会を設置したと発表した。

AI は人間の死亡時刻を 78% の精度で予測します

AI は人間の死亡時刻を 78% の精度で予測します

デンマークとアメリカの科学者は共同で、人間の死亡時刻を高精度で予測できる life2vec と呼ばれる AI システムを開発しました。

AIが尿音だけで泌尿器疾患を予測

AIが尿音だけで泌尿器疾患を予測

Audioflow と呼ばれる AI アルゴリズムは、排尿音を聞いて、異常な排尿の流れとそれに対応する患者の健康上の問題を効果的かつ首尾よく特定できます。

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

バーテンダーの皆さん、気をつけてください: このロボットはわずか 1 分でカクテルを作ることができます

日本では高齢化と人口減少により、特にサービス部門で大量の若年労働者が不足しています。

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

自分たちが愛した少女がAIの産物だと知り、何百人もの人々が幻滅した

u/LegalBeagle1966 という名前の Reddit ユーザーは、このプラットフォームで魅惑的な自撮り写真、さらにはヌード写真を頻繁に共有する映画スターのような女の子、クローディアに夢中になっている多くのユーザーの 1 人です。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

さらに 12 社の潜在的な企業がマイクロソフトの「AI アライアンス」に参加します。

Microsoft は、さらに 12 社のテクノロジー企業が AI for Good プログラムに参加すると発表しました。

AI がドラゴンボールのキャラクターを生身で再現

AI がドラゴンボールのキャラクターを生身で再現

ユーザー @mortecouille92 は、グラフィック デザイン ツール Midjourney の力を活用し、悟空、ベジータ、ブルマ、カメ長老などの有名なドラゴンボールのキャラクターのユニークでリアルなバージョンを作成しました。

ChatGPT の応答を改善する 7 つのテクニック

ChatGPT の応答を改善する 7 つのテクニック

いくつかの条件を追加したり、いくつかのシナリオを設定したりするだけで、ChatGPT はクエリに対してより適切な回答を与えることができます。ChatGPT 応答の品質を向上させる方法をいくつか見てみましょう。

人工知能が描く美しい絵画に驚嘆

人工知能が描く美しい絵画に驚嘆

Midjourney は、本物のアーティストに劣らない非常に美しい絵画のため、最近オンライン コミュニティとアーティスト界で「フィーバー」を引き起こしている人工知能システムです。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

この AI モデルは、武漢肺炎の発生に関するニュースを発見した最初の「専門家」の 1 人でした。

中国が発生を発表してから数日後、世界の航空券販売データにアクセスできるブルードットのAIシステムは、武漢コロナウイルスのバンコク、ソウル、台北、東京への感染拡大を正確に予測し続けた。