Запрет индексации 1-й страницы посредством robots.txt

12
K
На сайте с 25.03.2001
Offline
48
1835

Возможно ли запретить индексацию одной страницы посредством robots.txt? Или посредством robots.txt можно запрещать к индексированию лишь только целые директории?

Я знаю, что можно запретить индексацию страницы посредством тега noindex, но все же интересно, можно ли того же самого добиться инструкцией в файле robots.txt?

C
На сайте с 19.09.2001
Offline
120
#1
Как писал Kokoc
Возможно ли запретить индексацию одной страницы посредством robots.txt?

IMHO, можно написать примерно так:


UserAgent: *
Disallow: /index.html

При этом страница index.html индексироваться не будет, а все остальное вполне нормально проиндексируется.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#2

нет, если главная страница это ввв домен ру , то Disallow: /index.html - бесполезен,

не проще meta прописать ?

wolf
На сайте с 13.03.2001
Offline
1183
#3

Ошибочка вышла. Между словами User и Agent необходим дефис:


User-Agent: *
Disallow: /index.html

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
C
На сайте с 19.09.2001
Offline
120
#4
Ошибочка вышла. Между словами User и Agent необходим дефис.

Извиняюсь, прозевал.

нет, если главная страница это ввв домен ру, то Disallow: /index.html - бесполезен, не проще meta прописать?

Вопрос был о запрете индексации одной страницы. Пример получился неудачный. Пусть будет так:


User-Agent: *
Disallow: /news.html

А вот как будут вести себя роботы, если написать index.html, а ссылки есть как www.domain.ru, так и www.domain.ru/index.html?

LM
На сайте с 30.11.2001
Offline
71
LiM
#5
Как писал Cherny
А вот как будут вести себя роботы, если написать index.html, а ссылки есть как www.domain.ru, так и www.domain.ru/index.html?

Наиболее логичным способом - они проиндексируют www.domain.ru, но не будут индексировать www.domain.ru/index.html, а т.к. www.domain.ru/index.html поисковику не будет доступен, то он никогда не сможет узнать, что эти адреса - синонимы.

Хотя... конечно в поисковике могут и прописать, что эти адреса синонимичны по умолчанию...

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)
C
На сайте с 19.09.2001
Offline
120
#6

При запрете индексации страниц сайта, Гугл все равно показывает ссылки на эти страницы без каких-либо описаний. Можно предположить, что робот проверяет существование страницы. Таким образом, просто сравнив размеры файлов, например, можно натравливать робота-зеркальщика.

LM
На сайте с 30.11.2001
Offline
71
LiM
#7

Это скорее похоже на то, что в Яндексе значится как "найдено по ссылке" - робот не смотрит на страницу, но выдает ее потому, что кто-то на нее поставил ссылку. Значит, логично, что такая страница скорее всего есть.

wolf
На сайте с 13.03.2001
Offline
1183
#8
Это скорее похоже на то, что в Яндексе значится как "найдено по ссылке" - робот не смотрит на страницу, но выдает ее потому, что кто-то на нее поставил ссылку.

Не совсем так. Надпись "найдено по ссылке" появляется также и у проиндексированных страниц при условии, что ключевые слова из запроса присутствуют только в тексте ссылок на нее, но отсутствуют в тексте самой страницы.

LM
На сайте с 30.11.2001
Offline
71
LiM
#9

Именно потому я и сказал "похоже". ;)

A
На сайте с 19.02.2004
Offline
6
#10

А вот такой вопрос по robots.txt

Есть директория papka, в них есть куча других директорий p1, p1, ..., p4

В этих поддиректориях есть index.html

Можно как то одной строкой запретить все эти индексы или только перечислять каждый index

Disallow: /papka/p1/index.html

Disallow: /papka/p2/index.html

.............................

Disallow: /papka/pn/index.html

много поддиректорий

Напрягает...

Кто чего посоветует?

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий