Meta представляет Voicebox, модель искусственного интеллекта, которая поддерживает обработку звука для создателей

Meta представляет Voicebox, модель искусственного интеллекта, которая поддерживает обработку звука для создателей

После бесчисленных слухов Meta наконец официально анонсировала свою модель искусственного интеллекта последнего поколения под названием Voicebox. Эта модель предназначена для того, чтобы помочь создателям контента эффективно решать задачи, связанные с генерацией голоса, такие как редактирование звука, сэмплирование и стилизация, даже без специального обучения. Это возможно с помощью данных в контексте.

Мета уверенно утверждает, что эта новая модель искусственного интеллекта «принесет пользу многим людям во всем мире», а не только в области создания контента. Например, помогая слепым людям слышать текстовые сообщения голосом, а также позволяя людям говорить на иностранных языках собственным голосом.

Сам Voicebox рекламируется как способный как создавать высококачественные аудиоклипы, так и редактировать предварительно записанные аудиоклипы для удаления нежелательных помех, таких как автомобильные гудки, сохраняя при этом тот же многоязычный контент и стиль (воспроизводя речь на шести разных языках). Запланированные будущие разработки Meta для этой модели включают обеспечение естественных голосов визуальных помощников или персонажей в играх метавселенной.

Meta также сравнила Voicebox с другими моделями искусственного интеллекта на базе обработки звука, представленными в настоящее время на рынке, в частности с такими ключевыми конкурентами, как Vall-E и YourTTS. В целом, модель Meta является продвинутой и превосходит конкурентов при сравнении частоты ошибок в Word и сходства стилей.

Meta представляет Voicebox, модель искусственного интеллекта, которая поддерживает обработку звука для создателей

Meta представляет Voicebox, модель искусственного интеллекта, которая поддерживает обработку звука для создателей

Voicebox построен на Flow Matching. Это новейшая неавторегрессивная генеративная модель Meta, которая может обрабатывать весьма недетерминированные сопоставления между текстом и речью. Это позволяет Voicebox учиться на различных типах речевых данных без необходимости тщательно их маркировать, что дает ему возможность получить доступ к более разнообразным и крупномасштабным обучающим данным. На сегодняшний день Voicebox обучен более чем 50 000 часам записей речи и транскрипций аудиокниг на английском, французском, испанском, немецком, польском и португальском языках.

Хотя эта технология может открыть новую эру искусственного интеллекта в обработке звука, Мета признает, что она может создать потенциал для злоупотреблений и непреднамеренного вреда. В исследовательском документе, которым поделилась Meta о Voicebox, содержится подробная информация о том, как компания создала высокоэффективный классификатор, который может различать подлинные голоса и голоса, генерируемые Voicebox.

Meta не сделает программу AI Voicebox доступной для публичного использования и не выпустит исходный код, по крайней мере, на данный момент.


Рабочая группа ChatGPT будет создана Европой

Рабочая группа ChatGPT будет создана Европой

Орган, объединяющий европейских национальных наблюдателей за конфиденциальностью, заявил в четверг, что создал целевую группу, посвященную ChatGPT.

ИИ предсказывает время смерти человека с точностью 78%

ИИ предсказывает время смерти человека с точностью 78%

Датские и американские учёные совместно разработали систему искусственного интеллекта под названием life2vec, способную с высокой точностью предсказывать время смерти человека.

ИИ предсказывает заболевания мочевыводящих путей только по звуку мочи

ИИ предсказывает заболевания мочевыводящих путей только по звуку мочи

Алгоритм искусственного интеллекта под названием Audioflow может прослушивать звук мочеиспускания, чтобы эффективно и успешно идентифицировать аномальные выделения и соответствующие проблемы со здоровьем пациента.

Бармены, будьте осторожны: этот робот может приготовить коктейль всего за 1 минуту.

Бармены, будьте осторожны: этот робот может приготовить коктейль всего за 1 минуту.

Старение и сокращение населения Японии привело к тому, что в стране не хватает значительного числа молодых работников, особенно в сфере услуг.

Сотни людей разочаровались, когда узнали, что девушка, которую они любили, была продуктом искусственного интеллекта.

Сотни людей разочаровались, когда узнали, что девушка, которую они любили, была продуктом искусственного интеллекта.

Пользователь Reddit под ником u/LegalBeagle1966 — один из многих пользователей, влюбленных в Клаудию, девушку, похожую на кинозвезду, которая часто делится на этой платформе соблазнительными селфи, даже обнаженными.

Еще 12 потенциальных компаний присоединяются к «ИИ-альянсу» Microsoft.

Еще 12 потенциальных компаний присоединяются к «ИИ-альянсу» Microsoft.

Microsoft только что объявила, что еще 12 технологических компаний примут участие в ее программе AI for Good.

ИИ воссоздает персонажей Dragon Ball из плоти и крови

ИИ воссоздает персонажей Dragon Ball из плоти и крови

Пользователь @mortecouille92 применил возможности инструмента графического дизайна Midjourney и создал уникальные реалистичные версии знаменитых персонажей Dragon Ball, таких как Гоку, Вегета, Булма и старший Каме.

7 методов улучшения ответов ChatGPT

7 методов улучшения ответов ChatGPT

Просто добавив некоторые условия или настроив несколько сценариев, ChatGPT может дать более релевантные ответы на ваши запросы. Давайте посмотрим, как можно улучшить качество ответов ChatGPT.

Полюбуйтесь прекрасными картинами, нарисованными искусственным интеллектом.

Полюбуйтесь прекрасными картинами, нарисованными искусственным интеллектом.

Midjourney — это система искусственного интеллекта, которая в последнее время вызвала «лихорадку» в онлайн-сообществе и мире художников из-за своих чрезвычайно красивых картин, не уступающих работам настоящих художников.

Эта модель ИИ была одним из первых «экспертов», обнаруживших новости о вспышке уханьской пневмонии.

Эта модель ИИ была одним из первых «экспертов», обнаруживших новости о вспышке уханьской пневмонии.

Через несколько дней после того, как Китай объявил о вспышке, имея доступ к глобальным данным о продажах авиабилетов, система искусственного интеллекта BlueDot продолжала точно предсказывать распространение вируса уханьской короны в Бангкоке, Сеуле, Тайбэе и Токио.