Amazon의 AI 시스템은 Alexa의 음성 인식 오류를 15% 줄이는 데 도움이 됩니다.

Amazon의 AI 시스템은 Alexa의 음성 인식 오류를 15% 줄이는 데 도움이 됩니다.

몇 달 전 Amazon은 사용자가 특정 TV 모델, 인터넷 또는 라디오 광고에서 가상 비서를 깨울 때 Alexa가 정확한 응답을 제공하지 못하게 하는 여러 가지 문제를 자세히 설명했습니다. 결국 여기서 가장 중요한 문제는 Amazon의 음성 도우미가 환경에서 배경 소음을 효과적으로 필터링하여 사용자에게 보다 정확한 피드백을 제공할 수 있는 방법입니다. 최근 블로그 게시물과 End-to-End Anchored Speech Recognition이라는 연구 논문에서 Amazon 엔지니어는 인공 지능을 기반으로 한 새로운 소음 차단 기술을 구체적으로 제시했으며, 이는 Alexa의 음성 인식 및 명령을 15% 향상시키는 데 도움이 될 수 있습니다. 시스템 작동 방식에 대한 더 자세한 정보는 올해 말 브라이튼에서 개최될 음향, 음성 및 신호 처리에 관한 국제 회의에서 발표될 예정입니다.

Amazon의 AI 시스템은 Alexa의 음성 인식 오류를 15% 줄이는 데 도움이 됩니다.

“실제로 우리는 Alexa에게 의도되지 않은 명령을 "무시"하는 방법, 즉 주변 환경에서 발생하는 수많은 소음 중에서 명령을 선택하는 방법을 알려줌으로써 Alexa의 성능을 향상시키려고 항상 노력합니다. 이를 위해 우리는 스피커가 특정 깨우기 단어(보통 "Alexa")를 말하여 Alexa 지원 장치를 활성화한다고 가정합니다. 이는 가상 비서가 외부 소리의 혼란 속에서 격리하고 식별해야 하는 핵심 문구입니다. 환경. 기본적으로 우리의 기술은 깨우기 단어(보통 억양이나 음소의 유사성을 기반으로 함)일 수 있는 소리를 빠르게 "캡처"하고 이를 깨우기 단어와 비교하는 데 도움이 됩니다. 문장을 정확하게 식별하기 위한 표준입니다. 그런 다음 요소가 표준 깨우기 단어와 가장 밀접하게 일치하는 문장은 Alexa에 의해 명령으로 이해되고 다른 문장은 배경 소음으로 간주됩니다."라고 프로젝트를 담당하는 과학자 팀의 리더인 Xin Fan이 말했습니다. AI가 설명한다.

Xin Fan과 동료들은 배경 소음과 깨우기 단어를 구별하기 위해 별도의 AI 시스템을 훈련하는 대신 단어 일치 메커니즘을 지능 기반 음성 인식 모델과 병합했습니다. 과학자들은 디코더의 AI 아키텍처에 대한 두 가지 변형을 순차적으로 테스트했습니다. 즉, 입력 데이터(오디오 신호의 밀리초 길이 스냅샷)를 처리하는 아키텍처를 사용하여 해당 출력 시퀀스(사운드의 음소 렌더링)를 생성하는 것입니다. , 대부분의 기존 인코더-디코드 기술과 마찬가지로 인코딩 구성 요소는 입력 데이터를 벡터 고정 길이(숫자 문자열)로 요약하고 이를 출력 데이터로 변환합니다. 한편, 주변 환경의 하나 이상의 음성 문자열에서 깨우기 단어의 몇 가지 기본 특성을 감지하도록 "훈련된" 특별한 주의 메커니즘은 집합을 "안내"하는 역할을 담당합니다. 디코딩은 벡터의 이러한 특징에 더 많은 주의를 기울입니다.

Amazon의 AI 시스템은 Alexa의 음성 인식 오류를 15% 줄이는 데 도움이 됩니다.

실험에서 연구원들은 먼저 단어의 소리를 직접 비교하는 구성 요소를 추가하여 단어 발음 인식에 더 중점을 두도록 AI 모델 중 하나를 훈련했습니다. 인코딩 벡터의 비트를 압축하도록 훈련된 구성 요소입니다. 결과는 흥미로웠습니다. 이 모델은 오류율을 15%에서 13%로 줄였습니다.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.