Принятие кукисов поисковыми роботами

12
G
На сайте с 31.08.2009
Offline
11
797

по некоторым причинам сделал на сайте такую фишку в случае если клиентская сторона не принимает кукисы то скрипт останавливается и требует от пользователя обязательной поддержки кукис в браузере

Вопрос: поисковые роботы по умолчанию также как и обычный браузер принимает кукисы ? а то боюсь что гугл боту и ядекс боту будет показываться страница не та

16 строк моих записок очередный скрипт для сервера написан и пусть хостинг скоро ляжет от моих скриптов я все же черкаю очередных 16 строк cover Громкий
mgarkunov
На сайте с 23.03.2009
Offline
130
#1
greysniper:
Вопрос: поисковые роботы по умолчанию также как и обычный браузер принимает кукисы ? а то боюсь что гугл боту и ядекс боту будет показываться страница не та

Официальные работы имеет стандартный юзер-агент, поэтому их можно обрабатывать через юзер-агент, но это смахивает на клоакинг

Affiliate marketing в Рунете (http://affnet.ru)
G
На сайте с 31.08.2009
Offline
11
#2

Мне нужно знать принимает ли поисковые боты кукисы и все

Там нет клоакинга я просто выключаю сайт в случае если браузер не принимает кукисы на оформлении страницы это никак не отражается

I
На сайте с 22.10.2005
Offline
58
Iso
#3

greysniper, я бы не ожидал от роботов приёма кук. Но Вы легко можете выяснить точный ответ на этот вопрос для разных роботов, проанализировав свои логи. И, скорее всего, Вы убедитесь в том, что куки они не едят.

mgarkunov
На сайте с 23.03.2009
Offline
130
#4
greysniper:
Там нет клоакинга я просто выключаю сайт в случае если браузер не принимает кукисы на оформлении страницы это никак не отражается

У меня есть подозрения, что гугл умеет работать с куками, так как у него есть сервис индексации разделов защищенных учетными данными, но большинство роботов не работают с куками, так как они приходят забрать контент и потом отдают его анализатору, который уже анализирует загруженную страницу. Поисковый робот по сути делает копию сайта у себя.

Поэтому если это делается ради защиты DDOSа, то в инете можно найти список юзер-агентов поисковиков и для них выдавать страницу после проверки агента, а для остальных через куки.

ИМХО: Если аудитория сайта профессиональные интернет-пользователи, то будут проблемы. Я по умолчанию блокирую куки для всех новых сайтов и открываю запись кук только для сайтов, которые мне нужны...

K
На сайте с 31.01.2001
Offline
737
#5
greysniper:
сделал на сайте такую фишку

На JavaScript или PHP ?

Выделенные полосы в Москве (http://www.probkovorot.info) привели к снижению скорости до 23%.
G
На сайте с 31.08.2009
Offline
11
#6
Kost:
На JavaScript или PHP ?

сделано на PHP для того чтобы отсекать грабберы вида


$html=file_get_contents('http://saitex.ru');

на сайте есть контент который периодически пятаюстся сграбить парсерами вот это одна из линий обороны

mgarkunov
На сайте с 23.03.2009
Offline
130
#7
greysniper:
на сайте есть контент который периодически пятаюстся сграбить парсерами вот это одна из линий обороны

Сайт можно выкачать с работающими куками программой offline explorer и его аналогов.

K
На сайте с 31.01.2001
Offline
737
#8
greysniper:
на сайте есть контент который периодически пятаюстся сграбить парсерами вот это одна из линий обороны

Конечно, роботы не будут у себя хранить какие-то куки, им на них плевать.

Поэтому готовьтесь, что они контента не увидят.

Либо по User-Agent надо выдавать нормальный контент роботам поисковиков.

I
На сайте с 22.10.2005
Offline
58
Iso
#9
Kost:
Либо по User-Agent надо выдавать нормальный контент роботам поисковиков.

Но тогда исходная цель (защита от граббинка контента) отдалится ещё сильнее, так как любой балбес сможет прикинуться поисковиком. Если отличать поисковики, то по IP, а не по агенту.

С другой стороны, как только сайт попадёт в кэши поисковиков, его оттуда легко заберут, вообще не тревожа сервер топикстартера.

mgarkunov
На сайте с 23.03.2009
Offline
130
#10
Iso:
Если отличать поисковики, то по IP, а не по агенту.

Список IP изменяется, чтобы черные оптимизаторы не смогли манипулировать результатами поиска.

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий