Сохранённая копия яндекса. Делать или нет?

C8

54

comedy89

15 мая 2010, 12:38

1345

В руководстве яндекс.вебмастер прочитал что можно запрещать ссылку на сохраненную копию

"<meta name="robots" content="noarchive"/> — не показывать ссылку на сохраненную копию на странице результатов поиска."

Если я правильно понял то яндекс всё равно сохраняет копию у себя, просто не показывает ссылку на неё.

Какие плюсы и минусы от того от того что не будет ссылки на сохреннную копию?

Ухудшится ли распознавание яндексом первоисточника статьи или ранживование сайта если не будет этой ссылки, или она создана лишь для того чтобы если сайт временно недоступен то посетитель мог посмотреть сохраненую копию?

В мире существует 10 категорий людей: те кто знает двоичную систему и те кто нет... Лучшая Тизерка (http://redire.ru/tizer-block)! 230 копеек за клик по России!

106

mikes

15 мая 2010, 14:53

#1

comedy89:
Если я правильно понял то яндекс всё равно сохраняет копию у себя, просто не показывает ссылку на неё.

Верно. Приходится хранить исходный документ хотя бы для формирования сниппета. Вероятно, это не единственная необходимость.

comedy89:
Какие плюсы и минусы от того от того что не будет ссылки на сохреннную копию?

Не думаю, что это будет иметь негативный эффект в обозримом будущем. С другой стороны, Гугл ведь говорит, что возможно ухудшение ранжирования сайтов, запрещающих индексацию вебархивом. Т.е. поисковые системы используют все больше косвенных факторов. В общем, я бы не стал закрывать эту ссылку.

А зачем вам это, если не секрет?

Михаил Сливинский, руководитель службы по работе с вебмастерами, Яндекс

MG

135

MarvelousG

15 мая 2010, 15:15

#2

Гугл ведь говорит, что возможно ухудшение ранжирования сайтов, запрещающих индексацию вебархивом.

А где он это говорит?

W

276

Wadim

15 мая 2010, 18:29

#3

comedy89:
В руководстве яндекс.вебмастер прочитал что можно запрещать ссылку на сохраненную копию

"<meta name="robots" content="noarchive"/> — не показывать ссылку на сохраненную копию на странице результатов поиска."

Если я правильно понял то яндекс всё равно сохраняет копию у себя, просто не показывает ссылку на неё.
Какие плюсы и минусы от того от того что не будет ссылки на сохреннную копию?
Ухудшится ли распознавание яндексом первоисточника статьи или ранживование сайта если не будет этой ссылки, или она создана лишь для того чтобы если сайт временно недоступен то посетитель мог посмотреть сохраненую копию?

Плюсов не существует. Минус может быть, если вы захотите её сами посмотреть. ( больше никому она на хер не нужна :) )

ТОП3 Яндекса за 1-2 дня - это реально. Без роботности.

C8

54

comedy89

15 мая 2010, 18:44

#4

mikes:
Верно. Приходится хранить исходный документ хотя бы для формирования сниппета. Вероятно, это не единственная необходимость.

Не думаю, что это будет иметь негативный эффект в обозримом будущем. С другой стороны, Гугл ведь говорит, что возможно ухудшение ранжирования сайтов, запрещающих индексацию вебархивом. Т.е. поисковые системы используют все больше косвенных факторов. В общем, я бы не стал закрывать эту ссылку.

А зачем вам это, если не секрет?

Я веду самостоятельную статистику переходов по сайту и посетителей (php + mysql)

было замечено что с некоторых ip адресов было обращение в течение нескольких дней только на одни урлы (то есть из 40 запросов к сайту все на одну статью).

Таким образом могут парсить сайт.

Сейчас сайт немного такое вычисляет и банит по ip адресу.

+ если от одного пользователя слишком много запросов за короткое время то он или бот или скачивает сайт (через приготовленный парсер или через прогу-скачивалку).

таких я тоже бану - хорошо что таких не много.

Если человека забанить то он сможет просматривать только через прокси т.к. ip забанен (список прокси пока не знаю где достать).

(я конечно понимаю что вы сейчас начнете говорить что я таким образом мог забанить целую сеть пользователей)

Статей на сайте не много - контент интересный, (100 статей). сайт пока что новый поэтому трастовости нет у него.

а кто упёртый сильно тот может и через сохраненные копии контент вытащить.

вот подумал еще одну дырку закрыть.

Пока сайт будет лезть ввверх по позициям - архивную копию буду оставлять.

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

23

Safonkin

15 мая 2010, 19:53

#5

Блин, а я думал, если страница уже в индексе с неё нет смысла контент парсить :(

C8

54

comedy89

15 мая 2010, 21:33

#6

Ked32:
В целом это порочный путь. Есть другие способы защиты авторства, на серче как-то один продавался за большие деньги.

Много денег нет - ресурс пока что некоммерческий.

Первый год будет держаться на чистом энтузиазме (пока посещалка не поднимится)

Уже почти никто не парсит контент на свой сайт с помощью фрэймов (от них спасает яваскрипт)

а вот от php парсера трудно скрыться - поэтому приходится вести наблюдение за подозрительными визитами.

file_get_contents() и регулярных выражений достаточно чтобы полностью онлайн парсить сайт.

Когда посещений станет побольше и ИЦ подрастет тогда можно снять ограничение или сделать его более мягким.

Знаю сайт который недоступен сейчас а у него было 100 тыс.посещений в день с 5000 страниц.

Вот интересно если сайт уже 5 лет в индексе яши то если он после апдейта вылетит а кто-нибудь у себя зальёт копию сайт (вдруг у него такая была) или через сохреннёнку полезет, то когда старый сайт возобновит работу на сколько процентов он сохранит свои позиции

Тренды маркетинга в 2024 году: мобильные продажи, углубленная аналитика и ИИ

Google: E-E-A-T не является фактором ранжирования