Mediapartners-Google запрашивает неправильные url

12 3
[Удален]
2077

Вот не могу понять где глюк. На хостинге или у Гуглоидов.

Ситуация такая:

Пользователь просматривает страницу

... "GET /viewtopic.php?t=754 HTTP/1.1" ...

А сразу после него такая запись

... "GET /viewtopic.php%3Ft%3D754 HTTP/1.1" 404 837 "-" "Mediapartners-Google/2.1"

И в логах сервера появляются ошибки "File does not exist:"

Ank
На сайте с 26.04.2004
Offline
108
Ank
#1

рискну предположить, что Ваша cms не умеет обрабатывать такие последовательности.

Ибо %3F=? а %3D = "=".

Простейший скрипт и проблема снимется.

Вот такое глубокое имхо.

Ссылка за контент ( http://www.acma.ru ) прямая и безответная. ► [url=https://saas24.ru/saas_category/dedicated/?utm_source=forums&utm_medium=signatures&utm_campaign=dedicated_s24]Рейтинг серверов[/url] — ТОП10 ◄
[Удален]
#2

Какая cms?

Объявления Гугла стоят на форуме phpBB. Когда пользователь просматривает страницу с объявлением - Mediapartners-Google лезет посмотреть что на этой странице есть. И он сам определяет URL этой страницы.

Ank
На сайте с 26.04.2004
Offline
108
Ank
#3

все правильно. только гугл-партнер преобразует символы в такие. и Ваш сервер возвращает на них 404. вот и все.

форум в данном случае и выступает как cms - автоматом генерит хтмл по заданным правилам.

копать имхо в сторону модреврайта

а проверить еще проще, запустите что то типа wget и спросите с вопросиком и процентиком. на процентах получите 404.

Но может быть существует и более простой путь... вот на этом же форуме жил гугл-партнер и ничего, вроде все в тему показывал...

dkameleon
На сайте с 09.12.2005
Offline
386
#4

Ank,

Вы слишком глубоко роете.

В данном случае налицо повторного урлэнкодирования. Чего быть никак не должно.

значит, где-то что-то не так.

Mosik,

Проверил у себя в логах. У меня гугль так не извращается.

ПС. на Вордпрессе с реврайтом.

Дизайн интерьера (http://balabukha.com/)
[Удален]
#5

Так в том-то и вопрос. Почему Mediapartners-Google преобразует символы в такие? Ведь основной бот не преобразует а запрашивает нормальные урлы.

Ank
На сайте с 26.04.2004
Offline
108
Ank
#6
dkameleon:
Вы слишком глубоко роете.

видимо да :) тоже никогда не замечал подобного от гугла-партнера.. снимаются мои замечания. Что то не так в консерватории :)

[Удален]
#7

Теперь и на другом сайте такая-же ситуация.

Там cms абсолютно другая. Там все другое кроме хостера. А ситуация повторяется.

Посетитель запросил страницу:

/articles/stiralnye-mashiny-1-kakimi-byvayut-stiralnye-mashiny/#comments

Вот записи из лога:

86.57.136.244 - - [01/Dec/2006:13:55:42 +0200] "GET /articles/stiralnye-mashiny-1-kakimi-byvayut-stiralnye-mashiny/ HTTP/1.1" 200 7126 "http://www.topofarticles.com/" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1)"

66.249.66.169 - - [01/Dec/2006:13:55:43 +0200] "GET /articles/stiralnye-mashiny-1-kakimi-byvayut-stiralnye-mashiny/%23comments HTTP/1.1" 404 799 "-" "Mediapartners-Google/2.1"

Mediapartners-Google # преобразовал в %23 и при запросе урла получил 404

dkameleon
На сайте с 09.12.2005
Offline
386
#8

Mosik,

Перелистал логи более детально.

Есть такое, что гугль пытается запрашивать несуществующие документы и страницы.

Может, в вашем случае то же самое?

Все ли поголовно запросы от Медиапартнерс дают 404? или есть нормальные?

Ank
На сайте с 26.04.2004
Offline
108
Ank
#9
Mosik:
Там все другое кроме хостера.

не тут ли собака порылась?

[Удален]
#10
dkameleon:
Все ли поголовно запросы от Медиапартнерс дают 404? или есть нормальные?

Конечно есть нормальные. Те в которых не встречаются левые символы.

Ank:
не тут ли собака порылась?

Основной бот гугла в это-же время нормально бегает по сайтам. Как хостер может влиять на работу Гугловских Javascripts, которые определяют какой урл нужно запросить?

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий