Meta, 창작자를 위한 오디오 처리를 지원하는 AI 모델 Voicebox 출시

Meta, 창작자를 위한 오디오 처리를 지원하는 AI 모델 Voicebox 출시

수많은 소문 끝에 Meta는 마침내 Voicebox라는 최신 세대 AI 모델을 공식적으로 발표했습니다. 이 모델은 콘텐츠 제작자가 특정 교육 없이도 오디오 편집, 샘플링, 스타일화 등 음성 생성 관련 작업을 효율적으로 처리할 수 있도록 설계되었으며 상황에 맞는 데이터를 통해 가능합니다.

메타는 이 새로운 AI 모델이 콘텐츠 제작 분야뿐만 아니라 "전 세계 많은 사람들에게 이익을 줄 것"이라고 자신있게 단언합니다. 예를 들어, 시각 장애인이 자신의 목소리로 문자 메시지를 들을 수 있도록 돕는 것은 물론, 사람들이 자신의 목소리로 외국어를 말할 수 있도록 하는 것도 가능합니다.

Voicebox 자체는 고품질 오디오 클립을 생성하고 미리 녹음된 오디오 클립을 편집하여 자동차 경적 소리와 같은 원치 않는 방해 요소를 제거하는 동시에 동일한 다국어 콘텐츠와 스타일을 유지하면서(6개 언어로 음성 생성) 광고할 수 있습니다. 모델에 대한 Meta의 계획된 향후 개발에는 메타버스의 게임에서 시각적 보조자 또는 캐릭터에 자연스러운 음성을 제공하는 것이 포함됩니다.

Meta는 또한 Voicebox를 현재 시중에 나와 있는 다른 오디오 처리 기반 AI 모델, 특히 Vall-E 및 YourTTS와 같은 주요 경쟁업체와 비교했습니다. 전반적으로 Meta의 모델은 단어 오류율과 스타일 유사성을 비교할 때 경쟁사보다 앞서 있으며 성능이 뛰어납니다.

Meta, 창작자를 위한 오디오 처리를 지원하는 AI 모델 Voicebox 출시

Meta, 창작자를 위한 오디오 처리를 지원하는 AI 모델 Voicebox 출시

Voicebox는 Flow Matching을 기반으로 구축되었습니다. 이는 텍스트와 음성 간의 매우 비결정적인 매핑을 처리할 수 있는 Meta의 최신 비자동회귀 생성 모델입니다. 이를 통해 Voicebox는 신중하게 레이블을 지정할 필요 없이 다양한 유형의 음성 데이터로부터 학습할 수 있으므로 보다 다양하고 대규모의 교육 데이터에 액세스할 수 있습니다. 현재까지 Voicebox는 영어, 프랑스어, 스페인어, 독일어, 폴란드어 및 포르투갈어로 된 50,000시간 이상의 음성 녹음 및 오디오북 전사에 대한 교육을 받았습니다.

이 기술은 오디오 처리 분야에서 AI의 새로운 시대를 열 수 있지만 Meta는 남용 및 의도하지 않은 해를 끼칠 가능성이 있음을 인정합니다. Voicebox에 관해 Meta가 공유한 연구 논문에는 회사가 실제 음성과 Voicebox에서 생성된 음성을 구별할 수 있는 매우 효과적인 분류기를 어떻게 구축했는지에 대한 세부 정보가 포함되어 있습니다.

메타는 적어도 당분간은 AI 보이스박스 프로그램을 공개적으로 사용할 수 없게 만들거나 소스코드를 공개하지 않을 예정이다.


ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

ChatGPT 태스크포스는 유럽에서 설립될 예정입니다.

유럽의 국가 개인 정보 보호 감시 단체를 통합하는 기관은 목요일에 ChatGPT 전담 태스크 포스를 설립했다고 밝혔습니다.

AI는 78% 정확도로 인간 사망 시간 예측

AI는 78% 정확도로 인간 사망 시간 예측

덴마크와 미국 과학자들이 인간의 사망 시간을 높은 정확도로 예측할 수 있는 life2vec이라는 AI 시스템을 개발하기 위해 협력했습니다.

AI가 소변소리만으로 요로질환을 예측한다

AI가 소변소리만으로 요로질환을 예측한다

오디오플로우(Audioflow)라는 AI 알고리즘은 배뇨 소리를 듣고 환자의 비정상적인 흐름과 이에 따른 건강 문제를 효과적이고 성공적으로 식별할 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

바텐더 여러분, 조심하세요: 이 로봇은 단 1분 만에 칵테일을 만들 수 있습니다.

일본의 인구 노령화와 감소로 인해 특히 서비스 부문에서 상당한 수의 젊은 근로자가 부족해졌습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

수백 명의 사람들은 자신이 사랑했던 소녀가 AI의 산물이라는 사실을 알고 환멸을 느꼈습니다.

u/LegalBeagle1966이라는 Reddit 사용자는 이 플랫폼에서 매혹적인 셀카, 심지어 누드 셀카까지 자주 공유하는 영화배우 같은 소녀인 Claudia에 매료된 많은 사용자 중 한 명입니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

12개의 잠재적인 기업이 Microsoft의 AI 동맹에 합류했습니다.

Microsoft는 최근 12개의 기술 회사가 AI for Good 프로그램에 참여할 것이라고 발표했습니다.

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

AI가 드래곤볼 캐릭터를 살과 피로 재현합니다

사용자 @mortecouille92는 그래픽 디자인 도구 Midjourney의 강력한 기능을 활용하여 Goku, Vegeta, Bulma 및 Elder Kame과 같은 유명한 Dragon Ball 캐릭터의 독특하고 사실적인 버전을 만들었습니다. .

ChatGPT 응답을 개선하는 7가지 기술

ChatGPT 응답을 개선하는 7가지 기술

몇 가지 조건을 추가하거나 몇 가지 시나리오를 설정하는 것만으로도 ChatGPT는 쿼리에 대해 보다 관련성 높은 답변을 제공할 수 있습니다. ChatGPT 응답의 품질을 향상할 수 있는 몇 가지 방법을 살펴보겠습니다.

인공지능이 그린 아름다운 그림에 감탄해보세요

인공지능이 그린 아름다운 그림에 감탄해보세요

미드저니(Midjourney)는 실제 작가들의 그림에 뒤지지 않을 만큼 아름다운 그림들로 최근 온라인 커뮤니티와 화가계에 '열풍'을 일으키고 있는 인공지능 시스템이다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

이 AI 모델은 우한 폐렴 발생에 대한 뉴스를 발견한 최초의 전문가 중 하나였습니다.

중국이 발병을 발표한 지 며칠 후, BlueDot의 AI 시스템은 전 세계 항공권 판매 데이터에 액세스하여 우한 코로나 바이러스가 방콕, 서울, 타이베이, 도쿄로 확산되는 것을 계속해서 정확하게 예측했습니다.