Блокировка YandexGPT и прочих зловредов Яндекса

TheVS
На сайте с 27.12.2006
Offline
427
1161

В последнее время Яндекс начал очень агрессивно воровать чужой контент, выдавая его за труды своего ИИ. Известен минимум один случай, когда в топе висит ответ YandexGPT, полностью копирующий информацию со страницы с меткой МПК, задвинутой далеко-далеко в выдаче. Из-за возможного конфликта интересов возникла необходимость запретить Яндексу доступ к контенту для "обучения" своих нейросетей. Например, у ChatGPT от OpenAI такая возможность есть.

YandexGPT

В различных источниках мне попадалась информация, что этот сервис использует User Agent YandexGPT или yandex.gpt. Мне и моим знакомым не удалось найти такие визиты в логах, т.е. подтвердить или опровергнуть это я не могу. В официальной справке Яндекса по этому вопросу никакой информации нет.

Также я и мои "сообщники" не раз обращались с этим вопросом в службу поддержки Яндекса. На все запросы последовали абсолютно наитупейшие ответы, которые никак не касались YandexGPT. Один раз даже пришла инструкция из поддержки Алисы с тем, как полностью запретить всем роботам доступ к сайту. Т.е. даже не всем роботам Яндекса, а вообще всем. Хорошо, что даже в теории навредить себе таким советом было нельзя, т.к. код был написан с ошибкой. Делается ли это специально, либо же нынешние Платоны и Алисы просто тупые — тут можно только гадать. Местный форумный миньон Яндекса все вопросы на эту тему игнорирует, т.е. делает вид, что этих вопросов нет.

Лично я сделал субъективный вывод, что YandexGPT использует для обучения/воровства общую с поиском базу, т.е. как-то ограничить его невозможно. Возможно, есть какая-то стратегия воровства всего, что не прибито к полу, пока сверху до этого никому нет дела, как было в случае с островами. Но доказательств этого у меня нет.

YandexUserproxy

Этот "быстробот" используется для создания выжимок из контента в Яндекс Браузере. Посетитель получает короткую версию вашего контента, а вы потенциальный отказ в метрике и минус показ рекламы. Сейчас этот сервис активно рекламируется в различных видео в VK и т.п.
Можно заблокировать по User Agent YandexUserproxy, но если информация о вашей странице уже есть в их базе, то это не поможет. Блокируйте на свой страх и риск, т.к. я не знаю, что ещё оно может зацепить, но за неделю теста никаких побочных эффектов от этого я не заметил.


🍄 Партнёрская программа для вебмастеров: https://bit.ly/finance_pp
unspace
На сайте с 01.10.2012
Offline
303
#1
Не хотите, чтобы Яндекс воровал контент? Запрещайте для него индексацию сайта полностью. Не имейте с ним никаких дел вообще. Это единственный выход, как будет и в будущем ;)
TheVS
На сайте с 27.12.2006
Offline
427
#2
unspace #:
Не хотите, чтобы Яндекс воровал контент? Запрещайте для него индексацию сайта полностью.

Мне кажется, что всё уже в таком состоянии, что это не поможет.

Kaavain
На сайте с 28.07.2015
Offline
133
#3
Яндекс ворует у всех. Увы, единственный способ бороться с ними- брезговать всем от Яндекса. Лично я так и делаю, но увы, таких как я пока очень мало. 
Могу порекомендовать только хостинг: https://traf.at/vps - за 3 года все на 4++ и цены не подняли. Ну и банк для белых ИП: https://traf.at/bankm
B
На сайте с 22.07.2007
Offline
252
#4
TheVS :
Яндекс начал очень агрессивно воровать чужой контент, выдавая его за труды своего ИИ
Можно подать в суд на Яндекс, в случае реального воровства контента. Так можно заработать неплохие деньги.
TheVS
На сайте с 27.12.2006
Offline
427
#5
Baruchka #:
Можно подать в суд на Яндекс, в случае реального воровства контента. Так можно заработать неплохие деньги.
Ага, на островах уже заработали, правда только государство.
Search Google
На сайте с 14.01.2017
Offline
101
#6
https://searchengines.guru/ru/news/2057749

Гугловский так же можно блочить, но есть опаска стрельнуть себе же в ногу)
Google позволил защитить свой контент от использования в целях обучения ИИ - Новости
Google позволил защитить свой контент от использования в целях обучения ИИ - Новости
  • 2023.10.02
  • searchengines.guru
Google запуск нового краулера под названием . Новый юзер-агент отвечает за возможность использования контента сайта для обучения генеративных моделей искусственного интеллекта, на которых работают Bard, Vertex AI и другие разрабатываемые продукты Google AI. Для того, чтобы исключить использование контента сайта для обучения ИИ, вебмастера могут...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий