Google проигнорировал robots. Запрещенные страницы в выдаче.

12
sabotage
На сайте с 14.02.2007
Offline
192
1056

1. robots.txt составлен до индексации сайта, изменений не вносилось, валиден.

2. В логах нет ошибок загрузки robots

3. Бот Google исправно запрашивает и забирает его

4. В "Инструментах для веб-мастеров" => Анализ robots.txt показывает, что страницы запрещены

5. Урлы присутствуют в списке запрещенных к индексации

И, тем не менее, в выдаче появились больше сотни ненужных страниц. Суть топика - информация к размышлению.

ps интересующимся покажу сабж в ЛС.

BrokenBrake
На сайте с 03.03.2007
Offline
194
#1

Посмотрел сайт, информация в первом сообщении подтвердилась, файл корректный, страницы в индексе есть. Очень странно.

Наверно, стоит написать гугловцам.

Maximus325
На сайте с 27.01.2006
Offline
277
#2

Годичный боян. Часто запрещённые странички выдаются без снипета.

Нужен Eng копирайтер с опытом по теме казино, постоянные заказы.
BrokenBrake
На сайте с 03.03.2007
Offline
194
#3

Maximus325, если уже годичный, тем более странно. Почему google так себя ведёт?

BrokenBrake добавил 15.06.2008 в 04:50

P.S. Сниппета действительно нет.

Maximus325
На сайте с 27.01.2006
Offline
277
#4
BrokenBrake:
Maximus325, если уже годичный, тем более странно. Почему google так себя ведёт?

BrokenBrake добавил 15.06.2008 в 04:50
P.S. Сниппета действительно нет.

Видимо мощности позволяют. Впринципе, правильно, я бы на его месте себя также вел :D

BrokenBrake
На сайте с 03.03.2007
Offline
194
#5

Впрочем, выдаются эти страницы только по запросу site:example.com, по тексту они не находятся. И то ладно.

BrokenBrake добавил 15.06.2008 в 04:53

Maximus325:
Видимо мощности позволяют. Впринципе, правильно, я бы на его месте себя также вел

Ну это некультурно! :)

Maximus325
На сайте с 27.01.2006
Offline
277
#6

http://www.google.ru/robots.txt

User-agent: *
Allow: /searchhistory/
Disallow: /news?output=xhtml&
Allow: /news?output=xhtml
Disallow: /search
Disallow: /groups
Disallow: /images
Disallow: /catalogs
Disallow: /catalogues
Disallow: /news
Disallow: /nwshp
Disallow: /?
Disallow: /addurl/image?
Disallow: /pagead/
Disallow: /relpage/
Disallow: /relcontent
Disallow: /sorry/
Disallow: /imgres
Disallow: /keyword/
Disallow: /u/
Disallow: /univ/
Disallow: /cobrand
Disallow: /custom
Disallow: /advanced_group_search
Disallow: /advanced_search
Disallow: /googlesite
Disallow: /preferences
Disallow: /setprefs
Disallow: /swr
Disallow: /url
Disallow: /default
Disallow: /m?
Disallow: /m/?
Disallow: /m/lcb
Disallow: /m/search?
Disallow: /wml?
Disallow: /wml/?
Disallow: /wml/search?
Disallow: /xhtml?
Disallow: /xhtml/?
Disallow: /xhtml/search?
Disallow: /xml?
Disallow: /imode?
Disallow: /imode/?
Disallow: /imode/search?
Disallow: /jsky?
Disallow: /jsky/?
Disallow: /jsky/search?
Disallow: /pda?
Disallow: /pda/?
Disallow: /pda/search?
Disallow: /sprint_xhtml
Disallow: /sprint_wml
Disallow: /pqa
Disallow: /palm
Disallow: /gwt/
Disallow: /purchases
Disallow: /hws
Disallow: /bsd?
Disallow: /linux?
Disallow: /mac?
Disallow: /microsoft?
Disallow: /unclesam?
Disallow: /answers/search?q=
Disallow: /local?
Disallow: /local_url
Disallow: /froogle?
Disallow: /products?
Disallow: /froogle_
Disallow: /product_
Disallow: /products_
Disallow: /print
Disallow: /books
Disallow: /patents?
Disallow: /scholar?
Disallow: /complete
Disallow: /sponsoredlinks
Disallow: /videosearch?
Disallow: /videopreview?
Disallow: /videoprograminfo?
Disallow: /maps?
Disallow: /mapstt?
Disallow: /mapslt?
Disallow: /maps/stk/
Disallow: /mapabcpoi?
Disallow: /translate?
Disallow: /ie?
Disallow: /sms/demo?
Disallow: /katrina?
Disallow: /blogsearch?
Disallow: /blogsearch/
Disallow: /blogsearch_feeds
Disallow: /advanced_blog_search
Disallow: /reader/
Disallow: /uds/
Disallow: /chart?
Disallow: /transit?
Disallow: /mbd?
Disallow: /extern_js/
Disallow: /calendar/feeds/
Disallow: /calendar/ical/
Disallow: /cl2/feeds/
Disallow: /cl2/ical/
Disallow: /coop/directory
Disallow: /coop/manage
Disallow: /trends?
Disallow: /trends/music?
Disallow: /notebook/search?
Disallow: /music
Disallow: /browsersync
Disallow: /call
Disallow: /archivesearch?
Disallow: /archivesearch/url
Disallow: /archivesearch/advanced_search
Disallow: /base/search?
Disallow: /base/reportbadoffer
Disallow: /base/s2
Disallow: /urchin_test/
Disallow: /movies?
Disallow: /codesearch?
Disallow: /codesearch/feeds/search?
Disallow: /wapsearch?
Disallow: /safebrowsing
Disallow: /reviews/search?
Disallow: /orkut/albums
Disallow: /jsapi
Disallow: /views?
Disallow: /c/
Disallow: /cbk
Disallow: /recharge/dashboard/car
Disallow: /recharge/dashboard/static/
Disallow: /translate_c?
Disallow: /s2/profiles/me
Allow: /s2/profiles
Disallow: /s2
Disallow: /transconsole/portal/
Disallow: /gcc/
Disallow: /aclk
Disallow: /cse?
Disallow: /tbproxy/
Disallow: /MerchantSearchBeta/
Disallow: /ime/

http://www.google.ru/search?q=site:google.ru/groups&num=100&hl=ru&lr=&newwindow=1&suggon=0&safe=off&filter=0

Результаты 1 - 100 из приблизительно 18 600 с google.ru/groups

и т.д

Maximus325 добавил 15.06.2008 в 04:56

BrokenBrake:
Впрочем, выдаются эти страницы только по запросу site:example.com, по тексту они не находятся. И то ладно.

BrokenBrake добавил 15.06.2008 в 04:53

Ну это некультурно! :)

Победителей не судят :D

BrokenBrake
На сайте с 03.03.2007
Offline
194
#7
Maximus325:
Disallow: /MerchantSearchBeta/

Оффтоп. Ух ты... интересно, что там будет.

sabotage
На сайте с 14.02.2007
Offline
192
#8

Maximus325, боян может и годичный, только такие моменты даже победителя не красят.

На днях в выдаче гугла нашел дор (в топе по нч), в начало урла залез <br> и, естественно, по ссылке перейти было невозможно. Если есть желание взглянуть попробую найти.

Maximus325
На сайте с 27.01.2006
Offline
277
#9
sabotage:
Maximus325, боян может и годичный, только такие моменты даже победителя не красят.
На днях в выдаче гугла нашел дор (в топе по нч), в начало урла залез <br> и, естественно, по ссылке перейти было невозможно. Если есть желание взглянуть попробую найти.

непонял, в смысле XXS выдачи что ли?? неверю

sabotage
На сайте с 14.02.2007
Offline
192
#10

Однако нашел, отправил в личку. 🚬

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий