Недавно в SEO-сообществе активно обсуждалась новая технология GPT-3 (Generative Pre-trained Transformer 3), которую теоретически можно использовать для перевода текста. Однако Google не хочет видеть такой контент в своём индексе.
Сотрудник поиска Гэри Илш объяснил в Twitter, почему поисковик против такого контента, на примере текста, который в конечном итоге приобретает абсурдный смысл:
Why don't we want machine translated content in the index:
— Gary 鯨理/경리 Illyes (@methode) 15 августа 2020 г.
"All boiled together After boiling, the sugar dissolves can be used. Do not let boil for long Coconut milk will be children"
Basically we don't want coconut milk to become children. Essentially. pic.twitter.com/CMeAP2XfD2
«Мы не хотим, чтобы кокосовое молоко превращалось в детей», - отметил Илш.
В течение многих лет сотрудники Google объясняли, что машинный перевод может расцениваться как спам. Однако недавно в Google заявили, что его использование необязательно приводит к ручным санкциям.
Проблема в самом автоматическом переводе: ни одна система, даже самая лучшая, не способна дать идеальный результат.
Что касается GPT-3, то, по словам Илша, эта технология уступает существующим моделям перевода. Она просто не предназначена для этого. И даже для создания текста (хотя результаты иногда впечатляют), а большая часть её вывода – тарабарщина (60-70%).
fwiw gpt-3 underperforms compared to current translation models, it was just not designed for that. and even for (short) text generation, while it's really really impressive, the majority of its output is gibberish (60-70%, cf. Sam)
— Gary 鯨理/경리 Illyes (@methode) 15 августа 2020 г.
Если же на сайте используются инструменты машинного перевода, то полученный текст должны проверять люди.
i should've mentioned that curated (human reviewed) is fine
— Gary 鯨理/경리 Illyes (@methode) 17 августа 2020 г.
Отметим, что GPT-3 – авторегрессионная языковая модель от OpenAI, которая может выполнять разные задания по созданию текста на основе всего нескольких примеров. Кроме того, NLP-алгоритм может писать стихи, разгадывать анаграммы и переводить текст на другие языки.