Как запретить ИИ сканировать и ссылаться на свой сайт?

domen77
На сайте с 02.04.2020
Offline
44
438

Как запретить ИИ сканировать и ссылаться на свой сайт?


GreenLis
На сайте с 20.01.2017
Offline
79
#1
От всех не закроете. Можно собрать правила для наиболее часто встречающихся ботов.

User-agent: Google-Extended
Disallow: /

User-agent: GPTBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: PerplexityBot
Disallow: /

User-agent: ChatGenie
Disallow: /

User-agent: Jasper.ai
Disallow: /

User-agent: AnthropicBot
Disallow: /
User-agent: anthropic-ai
Disallow: /

User-agent: Claude
Disallow: /
User-agent: ClaudeBot
Disallow: /
User-agent: Claude-Web
Disallow: /

User-agent: GPTBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /

User-Agent: FacebookBot

Disallow: /
User-agent: PiplBot

Disallow: /
User-agent: Amazonbot

Disallow: /
User-agent: OmgiliBot
Disallow: /
User-Agent: omgili
Disallow: /

User-agent: cohere-ai
Disallow: /

User-agent: TurnitinBot
Disallow: /

User-agent: PetalBot
Disallow: /

User-agent: MoodleBot
Disallow: /

User-agent: magpie-crawler
Disallow: /

User-agent: ia_archiver
Disallow: /

User-Agent: YandexAdditional
Disallow: /

При этом следует понимать, что часть этих правил влияет на т.н. "быстре ответы от нейросети", которые присутствуют в серпе сразу после поисковой строки и дают некоторое количество трафика взамен на использование вашего контента не только для удовлетворения пользователя, но и для тренировки весов самой LLM.

UPD: можно реализовать по-другому - запретить сканы всем, кроме известных стандартных ботов-краулеров ПС. Опять же, от сотен появляющихся каждый год LLM не спасёт.
domen77
На сайте с 02.04.2020
Offline
44
#2
Всё-таки, как не дать тиражировать уникальную информацию на вашем сайте без визита живого человека на сайт? 
-S
На сайте с 10.12.2006
Offline
Модератор1355
#3
domen77 #:
Всё-таки, как не дать тиражировать уникальную информацию на вашем сайте без визита живого человека на сайт? 

Не публиковать в интернете.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий