Art569

Рейтинг
46
Регистрация
06.08.2006
Slavomir:
Во вторых, на сайт были наложены специфические фильтры. Благодаря анализу и разъяснениям фильтр наложенный по недоразумению сняли сразу же. Фильтр наложенный из-за ошибки снимать не стали, но он рассосался по прошествии некоторого времени.

Интересно. По вашим словам выходит, что если модераторы РСЯ могут налаживать фильтры, то они могут и забанить сайт. Правильно?

Art569 добавил 05.08.2009 в 17:42

Slavomir:
Модератор стопудово смотрит по тем параметрам, которые прописаны в справочной системе Яндекса, т.к. на них потом и ссылаются. Просто он человек и время у него ограничено. Когда модератор РСЯ отфутболил мой сайт, я проследил по логам весь его путь. Три раза переходил из своей контрольной панели, просмотрел всего шесть страниц, потратив на просмотр каждой от двух до семи секунд. Теоретический интервал (ХЗ, насколько рассинхронизировано время на сервере Яндекса и моего хостинга) между просмотром последней страницы и отправкой письма с отказом меньше минуты. Много можно понять и узнать о сайте при таком галопе? При этом еще успел наложить фильтры.
Вполне возможно, что опытные модераторы сайт, который вы привели в качестве примера, отфутболивают уже на уровне ощущений, распознавая их спинным мозгом.

А я у себя не видел по логам, что бы кто-то смотрел сайт. Просто был заход на главную страницу и бан был снят. Правда проблема была в том, что "Сайт был запрещен к индексации" (неудачно зарегистрировал домен).

На второй сайте, который сейчас в бане, кстати после подания заявки в РСЯ, я уже посторяюсь отследить.

Slavomir:
Модератор стопудово смотрит по тем параметрам, которые прописаны в справочной системе Яндекса, т.к. на них потом и ссылаются. Просто он человек и время у него ограничено. Когда модератор РСЯ отфутболил мой сайт, я проследил по логам весь его путь. Три раза переходил из своей контрольной панели, просмотрел всего шесть страниц, потратив на просмотр каждой от двух до семи секунд. Теоретический интервал (ХЗ, насколько рассинхронизировано время на сервере Яндекса и моего хостинга) между просмотром последней страницы и отправкой письма с отказом меньше минуты. Много можно понять и узнать о сайте при таком галопе? При этом еще успел наложить фильтры.
Вполне возможно, что опытные модераторы сайт, который вы привели в качестве примера, отфутболивают уже на уровне ощущений, распознавая их спинным мозгом.

А какая взаимосвязь РСЯ и Платона?

К счастью у меня только один сайт в бане. Поэтому предлагаю следующее.

Если Ваш сайт находится в бане у Яндекса и Вы готовы поделится лог файлом Apache для анализа, то жду ваших сообщений в ЛС.

Mantius:
Это уже глюки статистики скорее всего.

Тоже сначало так думал. Но нет, обработал июль месяц. Все тоже самое, только новые броузеры и форма запроса чуть изменилась.


Mozilla/4.0 (compatible; MSIE 5.5; Windows 98; FunWebProducts)
Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; MyIE2)
Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)
Opera/8.50 (Windows NT 5.1; U; ru)
Mozilla/5.0 (X11; U; Linux i686; ru; rv:1.9.1) Gecko/20090624 Firefox/3.5
Mantius:
Интересно! Судя по всему, посмотреть где бы сайт вывалился в выдаче проще, чем анализировать беки.

Так ссылающиеся сайты, тоже смотрели, но их конечно мало. Хотя я сейчас еще раз внимательно просмотрел и заметил интересную картину.

Поисковые заходы на забаненный сайт, не совпадает по времени с моим первым обращением в службу поддержки по этому сайту. И они периодически повторяются.

Решил ради эксперимента посмотреть, чем и как анализировали мой сайт, который сейчас находится в бане в Яндексе.

И так


77.88.18.194 - - [15/Jun/2009:09:55:29 +0400] "GET / HTTP/1.0" 200 4657 "-" "Jakarta Commons-HttpClient/3.0-rc1"
77.88.18.194 - - [15/Jun/2009:09:58:40 +0400] "GET /my.css HTTP/1.0" 200 1309 "-" "Java/1.5.0_11"
95.108.169.178 - - [15/Jun/2009:09:55:04 +0400] "GET / HTTP/1.0" 200 2026 "-" "Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.8.1.20) Gecko/20081217 Firefox/2.0.0.20 (.NET CLR 3.5.30729)"

Смотрели Firefox и какой-то Jakarta Commons-HttpClient, наверная ихняя программа.

А теперь еще интересней. Поисковым запросом, по которому продвигался сайт, хотя сайт уже отсутствовал в выдаче.


93.158.136.167 - - [10/Jun/2009:11:19:23 +0400] "GET /text/1.shtml HTTP/1.0" 200 4555 "http://www.yandex.ru/yandsearch?text=%D0%9D%D1%83+%D0%BE%D1%87%D0%B5%D0%BD%D1%8C+%D0%B8%D0%BD%D1%82%D0%B5%D1%80%D0%B5%D1%81%D0%BD%D1%8B%D0%B9+%D0%B7%D0%B0%D0%BF%D1%80%D0%BE%D1%81&stype=www" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)"

Были так же заходы и с других сайтов, которые ссылались на мой.

На сайт приходили и другие роботы Яндекса: Yandex/1.02.000 (compatible; Win16; F), Yandex/1.01.001 (compatible; Win16; P), Yandex/1.01.001 (compatible; Win16; I) и YandexSomething/1.0. У меня сложилось впечатление, что ихняя активность просто совпало по времени с анализом моего сайта сотрудниками Яндекса.

m@}{:
На счет логов - отслеживал по одному сайту.

Все как обычно - периодически заходит бот индексатор.

Я тогда сделал вывод, что Платон принимает решение исходя из уже скачанных страниц.

А вот мой один сайт смотрели с помощью Firefox из под какого-то linux, но сеть была Яндекса.

Mantius:
А у кого-то есть сомнения? Новый сайт добавляется роботом, а в индекс после бана возвращают люди.
Разумеется, что обмануть человека в стотыщьмиллионов раз сложнее, чем робота.

А после ваших писем в Yandex, Вы не обращали внимание на логи веб-сервера. Какие страницы просматривались из сети Yandex и с какими User-Agent'ами.

Mantius:
Кстати, тот факт, что открытым текстом не упоминается в чем именно проблема, говорит о том, что решение не так уж очевидно.

Возможно, отсутствие указания точной причины, кроется в желании защитить от

манипулирования поисковый алгоритм Yandex.

Mantius, я просто предположил и вовсе не утверждал. Но если Вы говорите значит, наверное, так и есть. Но тем не менее, Last-Modified исчез с вашего сервера.

Всего: 188