Странности индексации блога: может, что не так в robots.txt?

S
На сайте с 11.05.2012
Offline
9
559

Добрый день!

Имею следующие странности с индексацией своего WordPress блога.

Проблема №1. Директивы robots.txt не закрыли то, что не хочу видеть в индексе:

На блоге с момента его основания (сентябрь 2011) не было robots.txt. Сделал robots.txt в ночь с 8 на 9 Мая, когда я его залил, последняя дата посещения сайта роботом была 7 Мая. Затем днём 9 Мая пришел робот, а сегодня я увидел, что новое проидексированное содержание засветилось в таком виде:

http://<мой блог>/?cat=1

http://<мой блог>/?m=201204

http://<мой блог>/?cat=4

При том, что в robots.txt у меня стоит:

Disallow: /*?

Disallow: /*?*

Почему это не спасло от попадания в индекс /?cat=1 и /?m=201204 ?

Проблема №2. Не вижу человеко-понятные УРЛ в индексе. Вот ещё одна страничка, проиндексированная только что:

http://<мой блог>/?p=165

...а должна быть как:

http://<мой блог>/powershell-i-windows-adminka/powershell-dialogovoe-okno-windows-net.html

Плагин ЧПУ ставил 1 Мая днём.

Что делать?

Блог регистрации субъективных образов http://simreg.ru/ (http://simreg.ru/) Блог нового программирования http://newcoding.ru/ (http://newcoding.ru/)
promomaniac
На сайте с 10.03.2011
Offline
160
#1

У вас роботс неверно составлен

Меня смущает, что колода плохо перетасована, но лишь до тех пор, пока мне не придет хорошая карта. © Джонатан Свифт.
nik_kent
На сайте с 05.02.2008
Offline
193
#2
Simreg:
Сделал robots.txt в ночь с 8 на 9 Мая
Simreg:
Плагин ЧПУ ставил 1 Мая днём.
tools.promosite.ru:
СЕГОДНЯ!!!
11 мая 2012 [2:39 сохраненка] [3:30 RU+EN]
2:39 Обновление сохраненной копии, выложена от 28 апреля 2012
3:30 Текстовый апдейт: выложен индекс по 29 апреля 2012

10 символов

С уважением, Николай.
Slavietto
На сайте с 28.06.2009
Offline
76
#3
Simreg:

При том, что в robots.txt у меня стоит:
Disallow: /*?
Disallow: /*?*

Cмотрите, и в Яндекс, и в Гугл есть сервис для вебмастеров. У вебмастере можно посмотреть, доступна ли стр. для индексации при поточном robots.txt. Меняйте роботс и смотрите на эффект

S
На сайте с 11.05.2012
Offline
9
#4

Вебмастер-тулзы Яндекса и Гугла - давно зареган там, каждый день туда хожу:) сейчас ещё раз посмотрю внимательнее.

promomaniac:
У вас роботс неверно составлен

Где именно? Яндекс-вебмастер ошибок не находит.

На всякий случай поясню, что:

Disallow: /*?
Disallow: /*?*

...это фрагмент robots.txt, вот полное содержимое:

User-agent: *

Disallow: /cgi-bin

Disallow: /wp-content/plugins

Disallow: /wp-content/themes

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-login.php

Disallow: /wp-register.php

Disallow: /webstat/

Disallow: /feed/

Disallow: */feed

Disallow: /trackback

Disallow: */trackback

Disallow: /comments

Disallow: */comments

Disallow: /category/

Disallow: /author/

Disallow: /page/

Disallow: /tag/

Disallow: /*?

Disallow: /*?*

Disallow: /*.php

User-agent: Yandex

Disallow: /cgi-bin

Disallow: /wp-content/plugins

Disallow: /wp-content/themes

Disallow: /wp-admin/

Disallow: /wp-includes/

Disallow: /wp-login.php

Disallow: /wp-register.php

Disallow: /webstat/

Disallow: /feed/

Disallow: */feed

Disallow: /trackback

Disallow: */trackback

Disallow: /comments

Disallow: */comments

Disallow: /category/

Disallow: /author/

Disallow: /page/

Disallow: /tag/

Disallow: /*?

Disallow: /*?*

Disallow: /*.php

Host: simreg.ru

Sitemap: http://<Мой Блог>/sitemap.xml

Sitemap: http://<Мой Блог>/sitemap.xml.gz

---------- Добавлено 11.05.2012 в 13:39 ----------

nik_kent:
10 символов

А вот думаю, так и есть на самом деле, что Яндекс выложил старый индекс, до-майский! Просто выложил свой robots.txt для того, чтобы подкорректировать, если что не так в нём...

S
На сайте с 11.05.2012
Offline
9
#5

Коллеги, ура! Сегодня Яндекс обновил свой индекс, и все проблемы (№1 и №2) как рукой сняло!

Спасибо за поддержку!

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий