Webalta выходит на арену

Pike
На сайте с 13.07.2004
Offline
79
#371

Нормальный робот должен принимать-отдавать cookie. Тогда и с сессиями бороться легче будет

free hosting (http://rahost.com)
АГ
На сайте с 11.11.2005
Offline
21
#372
mixb:
а java сессии (типа jsessionid=9FD75D2AE73FDC648FE9F52AFE4DC65F) слабо? :)
в индексе уже появились страницы с такими сессиями

Вообще не слабо :)

АГ
На сайте с 11.11.2005
Offline
21
#373
Pike:
Нормальный робот должен принимать-отдавать cookie. Тогда и с сессиями бороться легче будет

Куки тут не причем, кучу сайтов построено так, что они просто редиректят на кривой урл типа domain/page?sses=ID и подругому либо не работают, либо работают но плохо. И что они там будут показывать не зависит от того, принимаешь ты куки или нет.

Pike
На сайте с 13.07.2004
Offline
79
#374
Алексей Гурешов:
Куки тут не причем, кучу сайтов построено так, что они просто редиректят на кривой урл типа domain/page?sses=ID и подругому либо не работают, либо работают но плохо. И что они там будут показывать не зависит от того, принимаешь ты куки или нет.

А можно хотя бы один-единственный пример из кучи?

Revan
На сайте с 09.09.2005
Offline
321
#375

http://www.tour.crimea.com/CARDS/index.php

пролинковка внутренняя... повсюду вылазят сессии

С уважением, Прокофьев Александр, founder KudaGo.com (http://kudago.com). Отдаем информацию обо всех мероприятиях в РФ + Киев по API (/ru/forum/912869) всем желающим.
АГ
На сайте с 11.11.2005
Offline
21
#376

приведу пример на конкуренте, тк у нас такого не лезет откровенно:

http://www.yandex.ru/yandsearch?text=phpsessid&stype=www

M
На сайте с 16.01.2003
Offline
129
#377
Алексей Гурешов:
Куки тут не причем, кучу сайтов построено так, что они просто редиректят на кривой урл типа domain/page?sses=ID и подругому либо не работают, либо работают но плохо. И что они там будут показывать не зависит от того, принимаешь ты куки или нет.

Ответ неверный, имхо. На моем сайте сделано так: чтобы не потерять ни одного потенциального покупателя (даже с отключенными куками) сайт, при первоначальном запросе генерит ссылки с сессиями. Если ответ браузера содержит инфу, что он поддерживает куки, то далее уже сессии не генерятся, а ИД сессии берется из кук.

Робот, судя по всему, на куки плюет, соответственно, каждый запрос к сайту трактуется сайтом как абсолютно новый (т.е. нужно сгенерить новую сессию) со всему вытекающими последствиями в виде перегрузки сервера избыточным количеством сессий и т.п.

АГ
На сайте с 11.11.2005
Offline
21
#378

mixb зачем тебе трекить робота? Врядли он что-то купит ;)

В данном случае нагрузка на тебя, тк нам в принципе все равно какая ссессия у тебя там. Java тоже попадает в отрубание, просто у нас сейчас есть специальное условие на 32 символа на параметр ссессии, поэтому может пролезать все что короче или длинее дефолта.

Ну и само собой сделан механизм защиты от зацикливания в данном случае. Кстати вопрос учить краулера кукам или нет у нас до сих пор открытый, тоесть сделать не проблема, вопрос надо ли?

АГ
На сайте с 11.11.2005
Offline
21
#379

В догонку - если у тебя свои скрипты и прочее - то почему бы вообще ботам не отдавать все страницы и не пытаться писать им куки?

Pike
На сайте с 13.07.2004
Offline
79
#380
Алексей Гурешов:
приведу пример на конкуренте, тк у нас такого не лезет откровенно:

http://www.yandex.ru/yandsearch?text=phpsessid&stype=www

Ну кучу я увидел. А где хоть один, который

Алексей Гурешов:
подругому либо не работают, либо работают но плохо

?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий