Особенности Disallow:

P
На сайте с 29.06.2009
Offline
39
274

Добрый день!

Подскажите, пожалуйста, в вопросе, касающемся robots.txt и директивы Disallow:

Ситуация:

на сайте есть главная страница. С главной страницы стоит одна ссылка на /alltovary/ (больше ссылок нет). На странице alltovary представлен список всех товаров, которые имеют урлы /tovar1/, /tovar2/ и т.д (alltovary - не используется).

Вопрос: если поставить в роботс disallow: /alltovary/ - войдут ли в индекс товары (ссылки на которые стоят только со страницы /alltovary/? (без карты сайта и прочих внешний и внутренних ссылок)

Вариант 1:

Не войдут. Яндекс говорит "Чтобы запретить доступ робота к некоторым частям сайта или сайту целиком, используйте директиву 'Disallow'", а если доступ роботу запрещен, то и ссылки не увидит.

Вариант 2:

Войдут. В процессе индексации робот все равно зайдет на страницу /alltovary/ и увидит все внутренние ссылки и проиндексирует их.

Всем откликнувшимся - заранее спасибо.

nik_kent
На сайте с 05.02.2008
Offline
193
#1

Вариант 2.

10 раз

С уважением, Николай.
SeOToM
На сайте с 14.11.2009
Offline
126
#2

Pushilin, можно было проверить это в Гугл.Вебмастер и Яндекс.Вебмастер. Сам парился с этими дисаловами.

flame666
На сайте с 15.06.2010
Offline
118
#3
Pushilin:

Вариант 2:
Войдут. В процессе индексации робот все равно зайдет на страницу /alltovary/ и увидит все внутренние ссылки и проиндексирует их.

Вариант 2 ☝ Яндекс всё равно шарится по сайту, и всё найдет. Просто не будет в поиске /alltovary/. Директива Dissalow запрещает яндексу класть в выдачу документы которые закрыты dissalow, но не запрещает ему туда заходить :)

Мир не Disney - помогай за respect (с)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий