마이크로소프트의 AI는 누군가의 목소리를 모방하는 데 3초가 걸린다

마이크로소프트의 AI는 누군가의 목소리를 모방하는 데 3초가 걸린다

마이크로소프트가 개발한 AI인 Vall-E는 실제 사람의 목소리를 3초 동안 들으면서 실제 사람의 말투와 말투를 모방할 수 있지만 여전히 로봇 목소리처럼 들립니다.

마이크로소프트의 AI는 누군가의 목소리를 모방하는 데 3초가 걸린다

마이크로소프트의 AI Vall-E. 일러스트 사진 : VallE-Demo.

Microsoft의 이 AI 시스템을 "신경 코덱 언어 모델"이라고 합니다. 코덱은 알고리즘을 사용하여 비디오를 처리하고 이를 바이트 스트림에 저장하는 도구입니다. 오디오 또는 비디오 파일은 축소된 후 다양한 목적으로 압축이 풀립니다.

Vall-E는 Microsoft가 2022년 Meta에서 개발한 기계 학습 기술을 사용하는 오디오 코덱인 EnCodec 플랫폼을 기반으로 구축되었습니다. Vall-E는 각 사람의 오디오를 캡처하고 분석하여 고유한 오디오 코덱을 만든 다음 EnCodec을 통해 정보를 "토큰"이라는 부분으로 분류합니다. 이는 일반적으로 파형 형태였던 기존의 문자 음성 변환 방식과 다릅니다.

그런 다음 Vall-E는 훈련 데이터를 사용하여 음성 억양에 대해 "알고 있는" 내용을 일치시키고 "학습한" 내용에 따라 다른 문구를 말할 수 있습니다.

이 전체 음성 모방 과정은 3초 안에 완료됩니다. 이는 오늘날 어떤 언어 모방 AI 시스템으로도 달성한 적이 없습니다.

Microsoft는 Vall-E를 교육하기 위해 7,000명 이상의 사람들이 말하는 60,000시간의 영어가 포함된 라이브러리를 사용합니다. 이 라이브러리는 시간이 지남에 따라 더 많은 언어로 추가될 예정입니다.

Microsoft는 Vall-E가 고품질 텍스트 음성 변환 소프트웨어에 적용되기를 희망합니다.

그러나 Vall-E는 악의적인 목적으로 사용될 수 있다는 우려를 낳고 있다. 이 AI는 악당이 사기 및 강탈을 목적으로 목소리를 가장하는 데 사용될 수 있습니다. 이 AI가 딥페이크 영상과 결합하면 위험 수준이 몇 배로 늘어날 수 있다.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.