Google bot ходит по непонятным url'ам

izbushka
На сайте с 08.06.2007
Offline
110
611

Заметил, что бот гугла иногда заходит на страницу, добавляя текст "/no-text-5149931813564902336" к урлу. Т.е. что-то вроде domain.com/path/no-text-5149931813564902336.

Казалось бы случайной число, однако поиск гугла нашел много совпадений на разных сайтах.

Откуда такие ссылки? И что самое неприятное, cms отдает страницу с кодом 200 по этому адресу..

Кто-нибуть сталкивался? Или все-таки у меня есть где-то такая ссылка?..

[Удален]
#1
izbushka:
Казалось бы случайной число, однако поиск гугла нашел много совпадений на разных сайтах.

Вероятно, на сайт стоят ссылки с подобными параметрами.

А отдавать стоит 404-ю, конечно.

izbushka
На сайте с 08.06.2007
Offline
110
#2

66.249.66.185 - - [21/Oct/2011:01:40:43 +0300] "GET /path/no-text-5149931813564902336 HTTP/1.1" 200 3318 "-" "Googlebot-Image/1.0" "-"

Причем делает это Googlebot-Image. Зачем ему вообще текстовые страницы?

Кстати, на этих страницах (без гуглевого суфикса) есть ссылки на просмотр картинок через JS (href=# onclick='...). Это никак не связано?

AK
На сайте с 10.01.2012
Offline
8
#3

Я тоже заметил, что Googlebot-Image ходит по ссылкам добавляя к ним no-text3931368032609782074

Т.е. есть реальные страницы:

domain.com/photos/

domain.com/info/phone/

Googlebot-Image ходит по:

domain.com/photos/no-text3931368032609782074

domain.com/info/phone/no-text3931368032609782074

У меня эти страницы возвращают 404.

Может кто знает, что за интересное поведение такое у Googlebot-Image?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий