Запрет индексации страниц с символом #

12
zaxavar
На сайте с 08.10.2012
Offline
183
1712

Здравствуйте!

Не нашел нигде информацию о том, как в robots запретить индексировать страницы в урлах которых имеется символ #.

Прошу помощи в этом вопросе.

Вместо или вместе с Adsene - Adsterra - https://publishers.adsterra.com/referral/wf8uqXSYuu Раcскажу, подскажу.
богоносец
На сайте с 30.01.2007
Offline
771
#1

Сначала покажите таковые в индексе

/ru/forum/928396

/ru/forum/928396

zaxavar
На сайте с 08.10.2012
Offline
183
#2
богоносец:
Сначала покажите таковые в индексе

/ru/forum/928396
/ru/forum/928396

Ну так я и не хочу, чтобы они попали в индекс.

Проблема такая. Есть урлы типа site.com/category

В них отображаются списком элементы. Эти элементы можно сортировать. При нажатии на ссылки сортировки к урлам добавляется #

site.com/category#

Если такие урлы в индекс не попадают - вопросов нет.

А если попадают - то это дубли.

Поэтому и спрашиваю.

Строго не судите.

Спасибо.

TM
На сайте с 19.03.2015
Offline
8
#3
богоносец:
Сначала покажите таковые в индексе

встречаются и такие в индексе - пример

но в данном примере урлы не на якоря, а просто страницы сайта на аяксе

p.s. ни разу не видел в robots.txt запрета # , так как смысла в этом совершенно нету

Smart Shot
На сайте с 03.09.2015
Offline
66
#4
Tech_master:
но в данном примере урлы не на якоря, а просто страницы сайта на аяксе

Да, а индексируется их html копия (это видно по url'у).

vskrytijazamkovmoskva.ru/#otkryt-zamok/xj2qj

Вот хелп.

Насколько я помню обычные #хэш страницы не индексируются. Ну точнее индексируется url, но #хэш никак не влияет. То есть не будет site.ru/abc и site.ru/abc#asd в индексе, будет только site.ru/abc

SEO группа в ВК, где ответят на любой ваш вопрос! (https://vk.com/hello_seo_world) Книга по интернет-маркетингу (http://smartshot.ru/seo-dlya-seoshnikov/) Блог по SEO (http://smartshot.ru/blog/)
L0
На сайте с 15.04.2015
Offline
76
#5
zaxavar:
Ну так я и не хочу, чтобы они попали в индекс.

Проблема такая. Есть урлы типа site.com/category

В них отображаются списком элементы. Эти элементы можно сортировать. При нажатии на ссылки сортировки к урлам добавляется #

site.com/category#

Если такие урлы в индекс не попадают - вопросов нет.
А если попадают - то это дубли.

Поэтому и спрашиваю.
Строго не судите.
Спасибо.

Попадают такие в индекс, если их движок генрит.

Заблокировать так в роботс

Disallow: /*#

если # в середине урл, то

Disallow: /*#*

Да, я опасен! Я говорю вам - правду
богоносец
На сайте с 30.01.2007
Offline
771
#6

А что означает символ # в robots.txt ?

Tech_master:
встречаются и такие в индексе - пример
но в данном примере урлы не на якоря, а просто страницы сайта на аяксе

Ну #!таких гораздо больше, их можно прямо по хелпу:

Disallow: *_escaped_fragment_

Ну вот возьмём сцылку

Браузер делает запрос

GET /showthread.php?&p=14380826 HTTP/1.1

Host: searchengines.guru

А #post14380826 в HTTP запросе нету.

Но таких сцылок понаставлено на этом форуме куча. Можно попытаться их найти.

Sezhers
На сайте с 30.11.2015
Offline
36
#7
Smart Shot:
Насколько я помню обычные #хэш страницы не индексируются. Ну точнее индексируется url, но #хэш никак не влияет. То есть не будет site.ru/abc и site.ru/abc#asd в индексе, будет только site.ru/abc

+1

Нашел даже цитату Джона Мюллера по этому вопросу:

"We generally ignore the "fragments" (as in http://domain.com/path#fragment) when crawling, indexing and ranking since this is generally just something that is handled on the client side. There are some cases where we're experimenting with showing them in the snippet, to help users to find parts of a page quicker, so if you have large pages, that might be something to consider. You do not need to (& cannot) mention these fragments in Webmaster Tools."

https://productforums.google.com/forum/#!category-topic/webmasters/crawling-indexing--ranking/C0BTQOzy46U

Т.е. Гугл по большей части игнорирует данные фрагменты.

GoRSS
На сайте с 29.07.2013
Offline
138
#8

# - это обычный html якорь, в индекс не попадает

#! - это ajax, такие страницы индексируются.

Переживать не о чем.

https://commersoft.ru - софт: Google Indexing [индексация в Гугле по API] - Webcontrol [мониторинг сайтов и доменов]
[Удален]
#9

богоносец, я бы уже не был столь уверенным

genjnat
На сайте с 08.10.2008
Offline
230
#10
Leks007:
Попадают такие в индекс, если их движок генрит.

Заблокировать так в роботс

Disallow: /*#

если # в середине урл, то

Disallow: /*#*

Редкий случай когда в одном посте каждое слово ерунда.

не попадают если без !, не получится таким образом использовать знак # в роботс.

Весь сайт к индексации закроете )

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий