Что хочет индексатор?

PHPExpert
На сайте с 04.02.2006
Offline
104
1072

Пытаясь понять почему мои сайты не индексируется я полез в логи.

а там такое

87.250.231.9 - - [21/Aug/2007:03:58:22 +0400] "GET http://mysite.ru/" 200 4446 "-" "Yandex/1.01.001 (compatible; Win16; I)"

87.250.231.9 - - [21/Aug/2007:03:58:17 +0400] "GET http://mysite.ru/" 200 4143 "-" "Yandex/1.01.001 (compatible; Win16; I)"

87.250.252.20 - - [21/Aug/2007:03:43:01 +0400] "GET http://mysite.ru/" 200 6167 "-" "Yandex/1.01.001 (compatible; Win16; I)"

87.250.231.9 - - [21/Aug/2007:03:58:14 +0400] "GET http://mysite.ru/" 200 3463 "-" "Yandex/1.01.001 (compatible; Win16; I)"

**** далее ещё около 30-ти строк ********

Индексатор заходит на одну и ту же страницу (главную) 30-40 раз подряд, пока сервер не выдаст ошибку 404

87.250.231.9 - - [21/Aug/2007:03:58:50 +0400] "GET http://mysite.ru/" 404 18 "-" "Yandex/1.01.001 (compatible; Win16; I)"

после чего уходит.

И так каждый день! В чём проблема?

I
На сайте с 13.08.2007
Offline
99
#1

Я думаю что вам следует обратиться на хостинг.

S
На сайте с 13.07.2007
Offline
56
#2

А вы уверены, что он именно эту страницу скачивает???

У меня в логах тоже самое прописано, других заходов нет. Но в индексе находится около 200 страниц ;)

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#3

1) а чо так сильно размер различается?

2) Last modified выдается ?

neznaika
На сайте с 28.06.2006
Offline
356
#4
PHPExpert:
пока сервер не выдаст ошибку 404

Почему это он ее должен выдавать?

Дорого покупаю настоящие сайты. Не инвестирую деньги и не беру кредиты.
PHPExpert
На сайте с 04.02.2006
Offline
104
#5
Igoor:
Я думаю что вам следует обратиться на хостинг.

Хостинг Peterhost.

Написал в суппорт, получил ответ.

Здравствуйте, Максим!
404 у вас описанна в скриптах. Видимо скрипт умный и при большом кол-ве запросов
страницы с одного айпи выдает 404 ошибку.
Обратитесь к яндексу и узнайте у них почему их бот индексирует вашу страницу столько
раз.

Скрипт WordPress.

solnikolay:
А вы уверены, что он именно эту страницу скачивает???
У меня в логах тоже самое прописано, других заходов нет. Но в индексе находится около 200 страниц

Судя по логам он заходит только на главную. Ну ещё заходил на одну XMl страницу. В WordPresse их несколько.

neznaika:
1) а чо так сильно размер различается?

2) Last modified выдается ?

Last modified выдаётся. Про размер точно сказать не могу.

neznaika:
Почему это он ее должен выдавать?

Может и правда какая-то защита в WordPress'е.

Попробую принудительно выдавать статус 200 средставми PHP

T.R.O.N
На сайте с 18.05.2004
Offline
314
#6

PHPExpert,

Смотрите

при входе с двух разных IP

87.250.252.20

87.250.231.9

выдается длина контента, отличная почти в 2 раза...

Может поэтому бот и пробивает, пытаясь найти "чернуху"...

Ищите проблему в "прыжках" контента. Явный глюк...

PS Ненавижу стандартные монстральные движки...

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
PHPExpert
На сайте с 04.02.2006
Offline
104
#7
T.R.O.N:
Ищите проблему в "прыжках" контента. Явный глюк...

Спасибо, попробую разобраться в чём проблема.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий