Megavolt, Когда меня банили в последний раз, прислали выдержку из логов поисковика. Могу сказать, что основа для бана слишком быстрые обращения к телу серпа, при том, что не вытягиваются картинки и т.д. Скоро обработка серпа роботомаи вовсе сойдет на нет, или просто нужно делать полную эмуляцию
Megavolt, для своих задач, я скрипт написал за вечер на перле
=AnGer=, Вы имете ввиду анализатор прокси на анонимность? Так Яша анонимные не пропускает. Когда начали банить раз в неделю перешел на Яша.xml и Вам советую.
Пробовал, слишком неточен. ПР - 50/50. Тиц - глюк как везде. Webalta - попал в 2 из 7. А главное - очень медленный ответ
ReMAXI,
Ваш скрипт забанят при частоте больше ~200-300 в час с одного IP.
Можно, но проблемы все теже. Асинхронность данных. Сторонний сервис всегда мение устойчив и более глючен чем Яша (глики сервиса накладываются на глюки яши). Хотя возможно, в отличии от яши, к стороннему можно будет идти через прокси или сокс.
Вожно вовсе воспользоваться такой вот штукой
http://prcy.net/image.php?type=7&url=http://yandex.ru
Можно даже программно считать цыфры =) Черех ж... конечно, но результат будет
Какое количество запросов в час с одного IP у Вас формируется?
Что касается 8-го числа, то у статистики RAX(LiveInternet) был большой апдейт. По енкторым сайтм у меня вчера вовсе висели нули целый день. На некоторых, не считались входы с Рамы. База сбора и база результатов связаны асинхронно. Как вариант Вы видели просто глюк перерасчета. Говорить об изменениях стоит после 4-5 дней стабильных результатов или при использовании нескольких разных статистических систем.
metton, я использую CommView. Штука очень унисерсальная, поэтому чуть сложная. Но не встречал того, что она не может.
The WishMaster,
Это верно. Побороть не удалось!
metton,
Как узнать?
1. береш ставиш себе тулбару яндекса.
2. Ставиш хороший снифер.
3. Ходиш по сайта м смотриш что тулбара передает и что получает.
Только так. Ибо зачем документировать то, что, по идее, не должно попадать в чужие руки.
из моих наблюдений
ver=. версия тулбара. Судя по всему нужна для статистики яши. число 1049 похоже на номер языка.
url - понятно
параметр target что-то для статистики. Меняется редко
show=1&thc=0 - состояние тулбара