Яндекс Браузер научился переводить видео с китайского языка

Нейросети Яндекс Браузера теперь могут переводить видео с китайского и автоматически накладывать русскую озвучку. Технология уже работает на YouTube, а чуть позже появится поддержка популярной китайской видеоплатформы Bilibili.

Яндекс Браузер сам предлагает перевести видео с китайского на YouTube сразу после того, как пользователь его откроет. Нужно просто нажать на кнопку «Перевести видео»:


Нейросети учатся на примерах, и они должны соответствовать определенным критериям. Готовых решений не было, поэтому разработчики Яндекса с нуля собрали собственный датасет. С помощью специального алгоритма они обработали 1,5 млн видео и выбрали 100 тысяч с качественными субтитрами на севернокитайском языке, которым владеет более миллиарда человек. Соответствие аудио и субтитров так важно, потому что именно по ним нейросеть учится понимать речь.

Превращение речи в текст — первый этап перевода, и для этого нейросетям браузера пришлось выучить тысячи иероглифов. Каждый из них читается как слог. Чтобы нейросеть научилась их понимать, весь необходимый для работы с китайским словарь разработчики закодировали в виде 10 000 токенов. Для сравнения, пять европейских языков, которые Яндекс Браузер научился переводить раньше, уместились в библиотеку на 5000 токенов. Один токен равен одному слогу или регулярно использующемуся сочетанию двух слогов. Одновременно с этим нейросеть обучили делить сплошной поток иероглифов на смысловые отрезки, чтобы точнее синхронизировать перевод с исходной речью и сделать его более качественным.

С самой сложной особенностью китайского, на понимание которой у людей уходят годы, нейросети браузера справились всего за месяц. Именно столько им потребовалось на изучение четырех тонов, определяющих смысл сказанного. Тон — это мелодический рисунок голоса. Один и тот же слог, произнесенный с повышением или понижением голоса, может означать совершенно разные вещи. А еще в китайском много омофонов — слов, которые звучат одинаково, но пишутся по-разному и обладают разным значением. Чтобы различать их, нейросети Яндекс Браузера умеют учитывать контекст.

Подробный рассказ об особенностях технологии опубликован в блоге компании на Хабре.

preview VK разработала решение для стратегического управления бизнесом и рисками

VK разработала решение для стратегического управления бизнесом и рисками

Его можно интегрировать с любыми корпоративными информационными системами
preview Объем утечек данных в первом квартале 2023 года вырос в 2,3 раза

Объем утечек данных в первом квартале 2023 года вырос в 2,3 раза

Подсчитали в DLBI
preview Сэм Альтман: OpenAI не занимается обучением модели GPT-5

Сэм Альтман: OpenAI не занимается обучением модели GPT-5

И не будет этого делать в течение некоторого времени
preview Депутаты Госдумы готовят законопроект, регулирующий использование ИИ

Депутаты Госдумы готовят законопроект, регулирующий использование ИИ

И ответственность за злоупотребления
preview Вышла новая версия Яндекс Браузера для организаций

Вышла новая версия Яндекс Браузера для организаций

С важными обновлениями политик безопасности
preview Opera добавила бесплатный VPN в браузер для iOS

Opera добавила бесплатный VPN в браузер для iOS

Функция станет доступна всем в ближайшие недели