Яндекс выложил в открытый доступ YaLM 100B

Яндекс выложил в открытый доступ YaLM 100B — нейросеть для генерации и обработки текстов на русском и английском языках. Это самая большая GPT-подобная модель, опубликованная в свободном доступе. Теперь её могут использовать разработчики и исследователи со всего мира.

YaLM 100В содержит 100 млрд параметров — больше, чем какая-либо из существующих моделей для русского языка. Это позволяет использовать ее для решения большого круга задач, связанных с обработкой естественного языка. Языковые модели из семейства YaLM определяют принцип построения текста и генерируют новые, опираясь на законы лингвистики и свои знания о мире. Например, они способны придумывать идеи для рекламных кампаний, создавать описания товаров и видео. С их помощью можно генерировать любые тексты (стихи, ответы, поздравления и так далее), а также классифицировать их, например, по стилю речи.    

Команда Яндекса использует нейросети YaLM более чем в 20 проектах, в том числе в Поиске и голосовом помощнике Алисе. Языковые модели помогают сотрудникам службы поддержки отвечать на обращения, генерируют рекламные объявления и описания сайтов (сниппеты). Нейросети YaLM широко используются также при подготовке быстрых ответов в Поиске.

Петр Попов, генеральный директор Яндекс Технологий:

«Для обучения такой большой языковой модели требуются огромные ресурсы, опытные специалисты и годы работы. А нам важно, чтобы доступ к современным технологиям был не только у крупнейших IT-компаний, а у всего сообщества исследователей и разработчиков. Выкладывая YaLM 100B в открытый доступ, мы рассчитываем, что это даст толчок развитию генеративных нейросетей».

Модель обучали на суперкомпьютерах Яндекса, которые были признаны самыми мощными в Восточной Европе. В процессе обучения YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках. Модель предоставляется по открытой лицензии Apache 2.0 и доступна на GitHub.

Ранее Яндекс открыл для сторонних компаний доступ к своему сервису верификации пользователей Yandex SmartCaptcha. С ее помощью компании смогут защитить сайт от роботов, фиктивных регистраций, спама и DDoS-атак. 

Источник: Яндекс
preview ВКонтакте намерена преобразовать сервис VK Видео в киноплатформу

ВКонтакте намерена преобразовать сервис VK Видео в киноплатформу

Увеличив долю собственного контента
preview Около 4 млн россиян перестали пользоваться зарубежными дейтинг-платформами

Около 4 млн россиян перестали пользоваться зарубежными дейтинг-платформами

На российские сервисы перешли только 12%
preview VK Play снижает комиссию для разработчиков игр до 5%

VK Play снижает комиссию для разработчиков игр до 5%

Для тех, которые сами приводят пользователей в игру
preview ВКонтакте поможет измерить текст в креативах с помощью ИИ

ВКонтакте поможет измерить текст в креативах с помощью ИИ

Робби все посчитает за несколько секунд
preview У Яндекса появился инструмент для оценки ИТ-навыков

У Яндекса появился инструмент для оценки ИТ-навыков

Пока только для разработчиков и аналитиков
preview Google Новости вернулись в Испанию

Google Новости вернулись в Испанию

После восьмилетнего перерыва