Игнор robots.txt или я может чего-то не знаю

StaticX
На сайте с 12.09.2010
Offline
11
310

Просматривая интересные и продвинутые в позициях сайты уже не раз вижу уникальную картину: в robots.txt сайт полностью запрещен для ботов, а в индексе поисковиков все странички присутствуют, есть ТИЦ и ПР нехилый...

Вот для примера сайт одного сеошника:

Сайт: http://seoprofy.net/

ТИЦ: 40

ПР: 3

Индекс Яшки: 694

Индекс Гошки: 733

Содержимое robots.txt (http://seoprofy.net/robots.txt):

User-agent: *
Disallow:

Получается:

1) на странички очень много ссылок снаружи и ПС просто в таком случае игнорит robots.txt

2) человеку лень возится с тем что индексить а что нет, он попросту влепил эту конструкцию, а такие конструкции(запрет всего) ПС игнорят.

3) какая-то супер-пупер секретная тема...

Проясните, пожалуйста, ситуацию если кто знает.... :)

Евгений Костин
На сайте с 15.04.2010
Offline
109
#1

Всего один символ после написанного запретит индексировать всё содержимое сайта: / (слеш). А как сейчас — всё ОК.

➤ Оптимизация и продвижение сайтов | SEO-аудиты | https://kostin.tv
SeVlad
На сайте с 03.11.2008
Offline
1609
#2
StaticX:
robots.txt сайт полностью запрещен для ботов
...
Сайт: http://seoprofy.net/
http://seoprofy.net/robots.txt:
User-agent: *
Disallow:
StaticX:
Получается:
...
3) какая-то супер-пупер секретная тема...

угу, суперсекрет :)

Палю его: учим роботс.тхт. Хотя бы тут:

Директивы Allow-Disallow без параметров.

Отсутствие параметров у директивы трактуется следующим образом:

User-agent: Yandex
Disallow: # то же, что и Allow: /

В крайнем случае проверяем индексацию страниц

Делаю хорошие сайты хорошим людям. Предпочтение коммерческим направлениям. Связь со мной через http://wp.me/P3YHjQ-3.
StaticX
На сайте с 12.09.2010
Offline
11
#3

Спасибо, SeVlad, оказывается я не достаточно внимательно читал доки

http://help.yandex.ua/webmaster/?id=1115958

User-agent: Yandex
Disallow: # те саме, що й Allow: /

Вопрос закрыт! :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий