Смотрите. Чисто технологически.
1) Если у вас есть задача проиндексировать текст (именно этот текст, который вы хотите спрятать), то его в любом случае в открытом виде придётся отдавать в html raw код. Это спарсят на раз-два, могут даже не загружая сайт, а через get/post запросы.
2) Если вы на индексацию целевой текст не отдаёте и условно отдаёте какую-нибудь текстовую рыбу, а пользователю потом в браузере выводите целевой текст, то вот здесь появляются варианты с тем, чтобы усложнить процесс воровства.
Теоретически можно выводить текст через кодированный JS и в отрендеренном виде заблокировать в браузере возможность просмотреть код. Можно в отложенном режиме по событию подкачивать текст по API с удалённого источника. Вот этом можно сделать. Скорее всего программная мысль работает именно в этом направлении.
Но! Кому действительно нужно забрать текст, он минуя браузер может делать скриншоты, обрезать, сохранить графическими файлами, а потом отправить в тот же Fine Reader на распознавание. На выходе - будет ваш текст в символьном виде.
Т.е. то, что человечески глаз увидит, можно будет забрать в том или ином виде.
Конечно.
Поэтому перед тем, как затевать, надо чётко понимать куда двигаться и для чего.
Вложиться в бот трафик, потратить несколько месяцев на создание доп. контента, а потом понять, что кроме возобновлённого трафика всё работает в минус - затея довольно унылая.
Ищите исполнителей на Кворке.
Открыл сейчас его профиль. Последняя активность по новым сообщениям у него была в 2022 году, причем активность из разряда "5-7 постов в год". Я на него почти не натыкался и вообще ни разу не общался. Как при таких раскладах я могу знать, кто он и что он?)
Сергей Людкевич один из немногих кто серьёзно занимался поисковым реверс инжирингом, определённо самый яркий и известный. Благодаря ему сообщество и вообще SEO индустрия использовала много поисковых техник, связанных с формулировками запросов (на его сайте можно почитать). Но с доминированием ПФ в Яндексе он отошел от темы Яндекса, а тот запросный инструментарий, которые он предлагал уже по большей части не работает.
А у Яндекса и нет конкретной задачи предоставлять SEO специалистам полезную информацию, они вещают информацию для широкого круга пользователей и вебмастеров. Там уж кому как.
Я так и думал.
Конечно, то, что предполагается для бесплатного ознакомления, покупать не будут, да и в целом, довольно быстро вырастут отказы.
Paywall, я уже писал выше.
Пусть покупают подписку.
Я думаю, что это бесплатный контент, раз уж там характеристика изделий.
Ну как же, Макс, ведь,
Михаил Сливинский, ныне руководитель отдела Я.Вебмастера, частный участник IT конференций, посвященных поиску, главный абмассадор Яндекса 😉
Тогда начните с капчи. Возможно она решит проблему.
Но если процесс парсинга контролируется, то это не поможет, в любом случае данные заберут.
Если это целевой сбор, то капчу могут ввести вручную, впрочем и для автоматических режимов есть методика использования антикапч сервисов.
Я бы начал с отсекания доступа для ненужных ASN.