Microsoft анонсировала DeepSpeed, новую библиотеку глубокого обучения, которая может поддерживать обучение сверхкрупномасштабных моделей искусственного интеллекта.

Microsoft анонсировала DeepSpeed, новую библиотеку глубокого обучения, которая может поддерживать обучение сверхкрупномасштабных моделей искусственного интеллекта.

Microsoft Research недавно вызвала переполох в мире исследований искусственного интеллекта (ИИ), когда объявила об успешной разработке DeepSpeed, библиотеки оптимизации глубокого обучения, которую можно использовать для обучения гигантских моделей ИИ с масштабом до 100 миллиардов параметров.

При обучении ИИ чем больше у вас моделей естественного языка, тем выше будет точность. Однако обучение больших моделей естественного языка требует много времени, а затраты немалые. DeepSpeed ​​был создан для преодоления всех вышеперечисленных трудностей: повышения скорости, стоимости, масштаба обучения и удобства использования.

Кроме того, Microsoft также упомянула, что DeepSpeed ​​также включает ZeRO (Zero Redundancy Optimizer), метод параллельной оптимизации, который помогает минимизировать количество ресурсов, необходимых для моделей, и в то же время помогает увеличить количество параметров, которые можно обучать. Используя комбинацию DeepSpeed ​​и ZeRO, исследователи Microsoft смогли успешно разработать новую модель Turing Natural Language Generation (Turing-NLG) — крупнейшую на сегодняшний день языковую модель с 17 миллиардами параметров.

Microsoft анонсировала DeepSpeed, новую библиотеку глубокого обучения, которая может поддерживать обучение сверхкрупномасштабных моделей искусственного интеллекта.

Некоторые основные моменты DeepSpeed:

  • Масштаб. Современные крупные продвинутые модели искусственного интеллекта, такие как OpenAI GPT-2, NVIDIA Megatron-LM и Google T5, имеют масштаб 1,5 миллиарда, 8,3 миллиарда и 11 миллиардов параметров соответственно. ZeRO stage 1 в DeepSpeed ​​может обеспечить поддержку системы для запуска моделей с числом до 100 миллиардов параметров, что в 10 раз больше, чем у самой крупной модели Google.
  • Скорость: зарегистрированное увеличение пропускной способности будет зависеть от конфигурации оборудования. На кластерах NVIDIA GPU с соединениями с низкой пропускной способностью (без NVIDIA NVLink или Infiniband) DeepSpeed ​​обеспечивает повышение пропускной способности в 3,75 раза по сравнению с использованием только Megatron-LM для стандартной модели GPT-2 с 1,5 миллиардами параметров. На кластерах NVIDIA DGX-2 с высокоскоростными соединениями для моделей с 20–80 миллиардами параметров DeepSpeed ​​работает в 3–5 раз быстрее.
  • Стоимость: благодаря повышению скорости затраты на обучение также значительно оптимизируются. Например, для обучения модели с 20 миллиардами параметров DeepSpeed ​​требует в 3 раза меньше ресурсов, чем обычно.
  • Удобство использования: Чтобы текущие модели могли переключиться на использование DeepSpeed ​​и ZeRO, необходимо лишь несколько незначительных изменений кода. DeepSpeed ​​не требует редизайна кода или рефакторинга модели.

Microsoft выкладывает исходный код DeepSpeed ​​и ZeRO в открытый доступ на GitHub , см.


Рабочая группа ChatGPT будет создана Европой

Рабочая группа ChatGPT будет создана Европой

Орган, объединяющий европейских национальных наблюдателей за конфиденциальностью, заявил в четверг, что создал целевую группу, посвященную ChatGPT.

ИИ предсказывает время смерти человека с точностью 78%

ИИ предсказывает время смерти человека с точностью 78%

Датские и американские учёные совместно разработали систему искусственного интеллекта под названием life2vec, способную с высокой точностью предсказывать время смерти человека.

ИИ предсказывает заболевания мочевыводящих путей только по звуку мочи

ИИ предсказывает заболевания мочевыводящих путей только по звуку мочи

Алгоритм искусственного интеллекта под названием Audioflow может прослушивать звук мочеиспускания, чтобы эффективно и успешно идентифицировать аномальные выделения и соответствующие проблемы со здоровьем пациента.

Бармены, будьте осторожны: этот робот может приготовить коктейль всего за 1 минуту.

Бармены, будьте осторожны: этот робот может приготовить коктейль всего за 1 минуту.

Старение и сокращение населения Японии привело к тому, что в стране не хватает значительного числа молодых работников, особенно в сфере услуг.

Сотни людей разочаровались, когда узнали, что девушка, которую они любили, была продуктом искусственного интеллекта.

Сотни людей разочаровались, когда узнали, что девушка, которую они любили, была продуктом искусственного интеллекта.

Пользователь Reddit под ником u/LegalBeagle1966 — один из многих пользователей, влюбленных в Клаудию, девушку, похожую на кинозвезду, которая часто делится на этой платформе соблазнительными селфи, даже обнаженными.

Еще 12 потенциальных компаний присоединяются к «ИИ-альянсу» Microsoft.

Еще 12 потенциальных компаний присоединяются к «ИИ-альянсу» Microsoft.

Microsoft только что объявила, что еще 12 технологических компаний примут участие в ее программе AI for Good.

ИИ воссоздает персонажей Dragon Ball из плоти и крови

ИИ воссоздает персонажей Dragon Ball из плоти и крови

Пользователь @mortecouille92 применил возможности инструмента графического дизайна Midjourney и создал уникальные реалистичные версии знаменитых персонажей Dragon Ball, таких как Гоку, Вегета, Булма и старший Каме.

7 методов улучшения ответов ChatGPT

7 методов улучшения ответов ChatGPT

Просто добавив некоторые условия или настроив несколько сценариев, ChatGPT может дать более релевантные ответы на ваши запросы. Давайте посмотрим, как можно улучшить качество ответов ChatGPT.

Полюбуйтесь прекрасными картинами, нарисованными искусственным интеллектом.

Полюбуйтесь прекрасными картинами, нарисованными искусственным интеллектом.

Midjourney — это система искусственного интеллекта, которая в последнее время вызвала «лихорадку» в онлайн-сообществе и мире художников из-за своих чрезвычайно красивых картин, не уступающих работам настоящих художников.

Эта модель ИИ была одним из первых «экспертов», обнаруживших новости о вспышке уханьской пневмонии.

Эта модель ИИ была одним из первых «экспертов», обнаруживших новости о вспышке уханьской пневмонии.

Через несколько дней после того, как Китай объявил о вспышке, имея доступ к глобальным данным о продажах авиабилетов, система искусственного интеллекта BlueDot продолжала точно предсказывать распространение вируса уханьской короны в Бангкоке, Сеуле, Тайбэе и Токио.