Оставляет в выдаче только одно из зеркал, причем ссылки на все зеркала ссумируются
Что-то глючит сейчас Гугль с зеркалами. Я с подобным тоже столкнулся. По запросам по адресу главной страницы Гугль сообщает, что два сайта - зеркала (выдает один из них на оба запроса), а в выдаче по фразе из title присутствуют оба.
Но ведь это страница, видимо, когда-то была на сайте. Робот ее нашел по ссылке, и периодически проверяет. А так как ему выдают 200 ОК, то он ее из базы не удаляет, а переиндексирует.
Не встречал такого.
А чтоб Яндексу нос утереть. Типа, мы к вебмастерам поворачиваемся лицом, в то время, как Яндекс - противоположным местом. :) Особенно хорошо смотрится на фоне яндексовских демаршей по отношению к вебмастерам (сокрытие ВИЦ'а, обет молчания и пр.)
А они, судя по всему как раз таки склеены. Причем, главной выбрана www.site.ru/Cat/cat.html
Сделайте поиск по запросу www.site.ru . Какая страница выдается?
Это еще не значит наверняка, что был пенальти. Бар после прошлого дэнса сильно глючил. Как справедливо заметил Cossak, складывалось такое впечатление, что он показывал мартовский PR и соответсвенно, многие сравнительно молодые сайты были с белой или серой полоской, хотя в выдаче смотрелись неплохо. У меня один такой сайт, опубликованный в феврале, в марте имел 0, в апреле - 5, в мае - снова 0 (не упав в выдаче по сравнению с апрелем), а сейчас - опять 5. Вот такие танцы...
Неправильно у Вас 404-я настроена. По адресу http://www.digital-market.ru/?chap=shop&com=shop_goods&act=search&obj=Kodak заголовок отклика сервера следующий:
Status: HTTP/1.1 200 OK Date: Thu, 19 Jun 2003 05:21:17 GMT Server: Apache/1.3.27 (Unix) mod_perl/1.26 PHP/4.3.1 AuthMySQL/2.20 X-Powered-By: PHP/4.3.1 Set-Cookie: PHPSESSID=ecbdcad48fe14e2a8076f024550e7adf; path=/ Expires: Thu, 19 Nov 1981 08:52:00 GMT Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0 Pragma: no-cache Connection: close Transfer-Encoding: chunked Content-Type: text/html
Робот получает 200 ОК и справедливо считает, что такая страница есть в природе. Поэтому и не удаляет ее из своей базы.
Но ведь известно, что важно не только количество, но и качество.
Но почему бы им не взять за единицу при нормировании, например, http://www.w3.org/ (кстати, тоже 10/10)?
Подветчик - это робот, который загружает текущую версию страницы по ссылке в выдаче "показать найденные слова" и подсвечивает на ней слова из запроса.
Зеркальщик - робот, который ищет зеркала сайтов