Запрет индексации 1-й страницы посредством robots.txt

48

Kokoc

9 сентября 2002, 08:32

1842

Возможно ли запретить индексацию одной страницы посредством robots.txt? Или посредством robots.txt можно запрещать к индексированию лишь только целые директории?

Я знаю, что можно запретить индексацию страницы посредством тега noindex, но все же интересно, можно ли того же самого добиться инструкцией в файле robots.txt?

C

120

Cherny

9 сентября 2002, 09:07

#1

Как писал Kokoc
Возможно ли запретить индексацию одной страницы посредством robots.txt?

IMHO, можно написать примерно так:


UserAgent: *

Disallow: /index.html

При этом страница index.html индексироваться не будет, а все остальное вполне нормально проиндексируется.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)

298

Григорий Селезнев

9 сентября 2002, 10:16

#2

нет, если главная страница это ввв домен ру , то Disallow: /index.html - бесполезен,

не проще meta прописать ?

1183

wolf

9 сентября 2002, 10:20

#3

Ошибочка вышла. Между словами User и Agent необходим дефис:

User-Agent: *
Disallow: /index.html

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )

C

120

Cherny

9 сентября 2002, 10:44

#4

Ошибочка вышла. Между словами User и Agent необходим дефис.

Извиняюсь, прозевал.

нет, если главная страница это ввв домен ру, то Disallow: /index.html - бесполезен, не проще meta прописать?

Вопрос был о запрете индексации одной страницы. Пример получился неудачный. Пусть будет так:


User-Agent: *

Disallow: /news.html

А вот как будут вести себя роботы, если написать index.html, а ссылки есть как www.domain.ru, так и www.domain.ru/index.html?

LM

71

LiM

9 сентября 2002, 10:53

#5

Как писал Cherny
А вот как будут вести себя роботы, если написать index.html, а ссылки есть как www.domain.ru, так и www.domain.ru/index.html?

Наиболее логичным способом - они проиндексируют www.domain.ru, но не будут индексировать www.domain.ru/index.html, а т.к. www.domain.ru/index.html поисковику не будет доступен, то он никогда не сможет узнать, что эти адреса - синонимы.

Хотя... конечно в поисковике могут и прописать, что эти адреса синонимичны по умолчанию...

С уважением, Андрей Хроленок. Загляни в FAQ по оптимизации и продвижению сайтов (http://www.seoman.ru/FAQ/) Анализатор страниц сайтов (http://www.seoman.ru/analizer/)

Не индексируются статьи в Яндекс цепляет в конец А вы точно доктор?

C

120

Cherny

9 сентября 2002, 11:14

#6

При запрете индексации страниц сайта, Гугл все равно показывает ссылки на эти страницы без каких-либо описаний. Можно предположить, что робот проверяет существование страницы. Таким образом, просто сравнив размеры файлов, например, можно натравливать робота-зеркальщика.

LM

71

LiM

9 сентября 2002, 20:26

#7

Это скорее похоже на то, что в Яндексе значится как "найдено по ссылке" - робот не смотрит на страницу, но выдает ее потому, что кто-то на нее поставил ссылку. Значит, логично, что такая страница скорее всего есть.

1183

wolf

10 сентября 2002, 05:22

#8

Это скорее похоже на то, что в Яндексе значится как "найдено по ссылке" - робот не смотрит на страницу, но выдает ее потому, что кто-то на нее поставил ссылку.

Не совсем так. Надпись "найдено по ссылке" появляется также и у проиндексированных страниц при условии, что ключевые слова из запроса присутствуют только в тексте ссылок на нее, но отсутствуют в тексте самой страницы.

LM

71

LiM

10 сентября 2002, 17:09

#9

Именно потому я и сказал "похоже". ;)

A

6

anvik

11 марта 2004, 11:16

#10

А вот такой вопрос по robots.txt

Есть директория papka, в них есть куча других директорий p1, p1, ..., p4

В этих поддиректориях есть index.html

Можно как то одной строкой запретить все эти индексы или только перечислять каждый index

Disallow: /papka/p1/index.html

Disallow: /papka/p2/index.html

.............................

Disallow: /papka/pn/index.html

много поддиректорий

Напрягает...

Кто чего посоветует?

eTarget 2011:Панельная дискуссия «Стратегия eTarget 2011: Круглый стол Могут ли «плохие» входящие

Что такое Power BI и зачем это нужно бизнесу

В 2023 году 36,9% всех DDoS-атак пришлось на сферу финансов