Всякие оффлайн браузеры могут скачивать картинки счетчиков вместе с другими картинками сайта. Это и может Рамблер считать как заходы роботов.
Правильный подход.
Любая, даже самая примитивная защита позволяет избавиться от подавляющего большинства гоблинов. Остальных остановить сложнее. Да и не надо, как правило - цель достигнута - сервер не перегружается.
Сергей,
А я ни с чего и не брал - я лишь дал один из возможных вариантов. О чем честно и сказал там же. :)
Master99, а Вы не пробовали смотреть в исходный код страницы результатов поиска? Вот именно оттуда эти данные... :)
А на Direct Hit технология похожа очень (очень!) отдаленно, т.к. в ней нет самой изюминки технологии Direct Hit - прямого влияния популярности ресурса на позицию в результатах поиска. Учет посещаемости в случае с Яндексом (если он вообще влияет) влияет только на частоту захода индексирующего робота.
KISS = Keep Is Simple, Stupid :D
Если можешь не писать, не пиши. Проще надо быть, товарищ... ;)
Посчитай, сколько у тебя запросов к web-серверу идет в сутки. А теперь подумай, долго ли будет исполняться твой файл для каждого из запросов? А если это помножить на посчитанное число запросов?..
Так и завалить сервак недолго...
Зависимость прямая.
У Яндекса есть возможности подсчитывать куда уходят пользователи с результатов поиска и сколько они пребывают на найденных сайтах. Если пользователь долго не возвращается, скорее всего он нашел то, что искал.
Плюс Яндекс имеет возможность оценивать сравнительную посещаемость различных сайтов через подсчет загрузок информации о тИЦе теми пользователями, которые в свой браузер установили Яндекс.Бар.
Всей этой информации вполне достаточно, чтобы делать выводы о том, какие ресурсы наиболее популярны у посетителей. Если к этому добавить тематическое разграничение, можно в список на ускоренную переиндексацию вносить наиболее популярные сайты в каждой тематической категории...
Вот вам и алгоритм. Я его, конечно, придумал только что из головы, но его реализация не так уж и сложна, если обладать упомянутой информацией.
Интересное наблюдение: параллельно с регистрацияей сайта в каталогах стали все чаще обращаться желающие обменяться ссылками. При этом народ идет исключительно целевой и понимающий чего они хотят и чего готовы предложить.
Просто напрашивается вывод, что даже если в каталогах немного обычных посетителей, там толкутся желающие зарегистрировать свои сайты. А то, что они обращаются с передложениями обменяться ссылками, может заметно сказаться на тИЦ сайта в положительном плане.
Если не ошибаюсь, "DISCo Pump" пишется через пробел.
Тогда понятно, почему в имени агента стоит в середине слэш. Вот только пробела после этого слэша у Вас не наблюдается...
А Вы чем проверяли? Уж не им ли?.. :)
"Картиночный" робот Яндекса выкачивает только картинки - факт. Всю прочую информацию ему поставляет индексирующий робот.
В качестве способов защиты от перенагрузки сервера от любителей тотального скачивания сайтов могу рассказать следующее: на одном из подшефных мне сайтов сделана система ловушек, которые расположены на всех критичных страницах и устроены так, что ловят на себя всех роботов, которые не соблюдают правила robots.txt + игнорируют <META CONTENT="Robots"...>. Как только кто-либо попадает хотя бы в одну из ловушек, против него идут санкции, направленные на прекращение его активности. Чтобы человек поздно спохватился, начало санкций имитирует сильную перенагрузку сервера (при том, что другие пользователи нормально работают и проблем не знают).
Подробнее рассказывать не могу - не хочется заново делать защиту, если ее научатся обходить слишком много гоблинов.
Увы, такая защита не помогает от особо заинтересованных - кто подумает, может легко ее обойти. Но таких мало - за 2 года работы сайта всего была пара человек...
Каким методом производится печать логотипа?
Есть ли на футболке изображение на спине?
Предполагается ли выпустить футболки иных расцветок и, особенно, размеров побольше. А то наряжать любимую девушку в такую футболку, конечно, приятно... ;)