Das KI-System von Amazon trägt dazu bei, Spracherkennungsfehler bei Alexa um 15 % zu reduzieren.

Das KI-System von Amazon trägt dazu bei, Spracherkennungsfehler bei Alexa um 15 % zu reduzieren.

Vor einigen Monaten hat Amazon eine Reihe von Problemen detailliert beschrieben, die Alexa daran hinderten, genaue Antworten zu geben, wenn Benutzer den virtuellen Assistenten auf bestimmten TV-Modellen, in Internet- oder Radiowerbung aktivierten. . Denn hier geht es vor allem darum, wie der Sprachassistent von Amazon Hintergrundgeräusche aus der Umgebung effektiv herausfiltern kann, um Nutzern präziseres Feedback zu geben. Kürzlich stellten Amazon-Ingenieure in einem Blogbeitrag und einem begleitenden Forschungspapier mit dem Titel „End-to-End Anchored Speech Recognition“ speziell eine neue Technik zur Geräuschisolierung vor, die auf künstlicher Intelligenz basiert und dazu beitragen kann, die Spracherkennung und Befehle von Alexa um 15 % zu verbessern. Detailliertere Informationen über die Funktionsweise des Systems werden voraussichtlich später in diesem Jahr auf der International Conference on Acoustics, Speech and Signal Processing in Brighton präsentiert.

Das KI-System von Amazon trägt dazu bei, Spracherkennungsfehler bei Alexa um 15 % zu reduzieren.

„Tatsächlich versuchen wir immer, Alexas Leistung zu verbessern, indem wir ihr beibringen, Befehle zu „ignorieren“, die nicht für sie bestimmt sind, mit anderen Worten, wie sie Befehle aus unzähligen Geräuschen aus der Umgebung auswählen kann. Dazu gehen wir davon aus, dass der Sprecher ein Alexa-fähiges Gerät aktiviert, indem er ein bestimmtes Weckwort sagt – normalerweise „Alexa“. – und das ist der Schlüsselbegriff, den der virtuelle Assistent in einem Chaos von Geräuschen von außen isolieren und identifizieren muss Umfeld. Grundsätzlich hilft unsere Technik dabei, Geräusche, bei denen es sich möglicherweise um Weckwörter handelt (normalerweise basierend auf Ähnlichkeiten in der Intonation oder den Phonemen), schnell zu „erfassen“ und sie mit Weckwörtern zu vergleichen. Standard zur genauen Identifizierung von Sätzen. Dann wird der Satz, dessen Elemente am ehesten mit dem Standard-Weckwort übereinstimmen, von Alexa als Befehl verstanden, während die anderen Sätze als Hintergrundgeräusch betrachtet werden“, sagte Xin Fan, Leiter des für das Projekt verantwortlichen Wissenschaftlerteams. Alexa KI erklärt.

Anstatt ein separates KI-System zu trainieren, um zwischen Hintergrundgeräuschen und Weckwörtern zu unterscheiden, haben Xin Fan und Kollegen ihren Wortvergleichsmechanismus mit einem auf Intelligenz basierenden Spracherkennungsmodell zusammengeführt. Standard künstlich. Die Wissenschaftler testeten nacheinander zwei Varianten der KI-Architektur des Decoders – das heißt, sie verwendeten eine Architektur, die die Eingabedaten (millisekundenlange Schnappschüsse des Audiosignals) verarbeitet, um eine entsprechende Ausgabesequenz (phonemische Wiedergabe des Tons) zu erzeugen – und Wie bei den meisten herkömmlichen Encoder-Decodiertechniken fasst die Codierungskomponente die Eingabedaten als Vektor fester Länge (eine Zahlenfolge) zusammen und wandelt sie in Ausgabedaten um. In der Zwischenzeit wird ein spezieller Aufmerksamkeitsmechanismus, der darauf „trainiert“ ist, einige grundlegende Merkmale von Aktivierungswörtern in einer oder mehreren Sprachzeichenfolgen aus der Umgebung zu erkennen, für die „Führung“ des Satzes verantwortlich sein. Bei der Decodierung wird diesen Merkmalen im Vektor mehr Aufmerksamkeit geschenkt.

Das KI-System von Amazon trägt dazu bei, Spracherkennungsfehler bei Alexa um 15 % zu reduzieren.

In einem Experiment trainierten die Forscher eines ihrer KI-Modelle, um mehr Wert auf die Erkennung der Wortaussprache zu legen, indem sie zunächst eine Komponente hinzufügten, die die Laute von Wörtern direkt mit verschiedenen Aussprachen vergleicht, und diese resultierenden Daten dann als Eingabe für ein anderes Wort verwendet Komponente, die darauf trainiert wurde, die Bits des Codierungsvektors zu komprimieren. Die Ergebnisse waren interessant, dieses Modell reduzierte die Fehlerquote auf 13 % im Vergleich zu 15 %.


Die ChatGPT-Task Force wird von Europa eingerichtet

Die ChatGPT-Task Force wird von Europa eingerichtet

Das Gremium, das die nationalen Datenschutzbeauftragten Europas vereint, gab am Donnerstag bekannt, dass es eine Task Force für ChatGPT eingerichtet habe

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

KI sagt den Zeitpunkt des menschlichen Todes mit einer Genauigkeit von 78 % voraus

Dänische und amerikanische Wissenschaftler haben gemeinsam ein KI-System namens life2vec entwickelt, das den Zeitpunkt des menschlichen Todes mit hoher Genauigkeit vorhersagen kann.

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

KI sagt Harnwegserkrankungen allein durch das Geräusch des Urins voraus

Ein KI-Algorithmus namens Audioflow kann auf das Geräusch des Urinierens hören, um abnormale Urinflüsse und entsprechende Gesundheitsprobleme des Patienten effektiv und erfolgreich zu identifizieren.

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Barkeeper aufgepasst: Dieser Roboter mixt einen Cocktail in nur 1 Minute

Japans alternde und schrumpfende Bevölkerung hat dazu geführt, dass dem Land eine erhebliche Zahl junger Arbeitskräfte fehlt, insbesondere im Dienstleistungssektor.

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Hunderte Menschen waren desillusioniert, als sie erfuhren, dass das Mädchen, das sie liebten, ein Produkt der KI war

Ein Reddit-Benutzer namens u/LegalBeagle1966 ist einer von vielen Benutzern, die in Claudia verliebt sind, ein Mädchen wie ein Filmstar, das auf dieser Plattform oft verführerische Selfies, sogar nackte, teilt.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

12 weitere potenzielle Unternehmen treten der „AI Alliance“ von Microsoft bei.

Microsoft hat gerade angekündigt, dass zwölf weitere Technologieunternehmen an seinem AI for Good-Programm teilnehmen werden.

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Die KI erschafft Dragon Ball-Charaktere aus Fleisch und Blut

Benutzer @mortecouille92 hat die Leistungsfähigkeit des Grafikdesign-Tools Midjourney genutzt und einzigartig realistische Versionen berühmter Dragon Ball-Charaktere wie Goku, Vegeta, Bulma und Elder Kame erstellt. .

7 Techniken zur Verbesserung von ChatGPT-Antworten

7 Techniken zur Verbesserung von ChatGPT-Antworten

Durch einfaches Hinzufügen einiger Bedingungen oder Einrichten einiger Szenarien kann ChatGPT relevantere Antworten auf Ihre Fragen geben. Schauen wir uns einige Möglichkeiten an, wie Sie die Qualität Ihrer ChatGPT-Antworten verbessern können.

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Bewundern Sie die wunderschönen Gemälde, die von künstlicher Intelligenz gezeichnet wurden

Midjourney ist ein künstliches Intelligenzsystem, das aufgrund seiner äußerst schönen Gemälde, die denen echter Künstler in nichts nachstehen, in letzter Zeit in der Online-Community und der Künstlerwelt für „Fieber“ gesorgt hat.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Dieses KI-Modell war einer der ersten „Experten“, der Neuigkeiten über den Ausbruch der Wuhan-Lungenentzündung entdeckte.

Tage nachdem China den Ausbruch bekannt gegeben hatte, konnte das KI-System von BlueDot mit Zugriff auf weltweite Flugscheinverkaufsdaten die Ausbreitung des Wuhan-Corona-Virus nach Bangkok, Seoul, Taipeh und Tokio weiterhin genau vorhersagen.