помогите закрыть от индексации страницы вида...

1 234
ultrabyte
На сайте с 28.01.2006
Offline
80
#21
ref:
ultrabyte, а где приведены такие правила, насчет возможности использования dissallow: .."кусок урла из середины"..? Если несложно...

Ищите слова:

Чтобы запретить роботу посещение динамических страниц, можно использовать частичный путь.

У самого стоит disalow:/? и прекрасно работает.

дело не в куске урла. а в первом(ых) встречающехся символах после которых адрес не учитывается.

За клиента на продвижение, откат 20% (http://qjp.ru/index.php/2009-03-04-06-46-45)
Jackyk
На сайте с 05.10.2005
Offline
342
#22
ultrabyte:
Ищите слова:
Чтобы запретить роботу посещение динамических страниц, можно использовать частичный путь.

В контексте того, что написано в указанной статье, если я правильно понял, под "частичным путем" имеется в виду "не до конца", а не "не с начала".

С уважением, Евгений.
ultrabyte
На сайте с 28.01.2006
Offline
80
#23
Jackyk:
В контексте того, что написано в указанной статье, если я правильно понял, под "частичным путем" имеется в виду "не до конца", а не "не с начала".

Да правильно поняли, disalow это же запрет.

тоесть disalow:/?

разрешит index.php

но запретит index.php?PHPSESIONID=12345

Jackyk
На сайте с 05.10.2005
Offline
342
#24

Все же не могли бы Вы привести прямо здесь конкретную цитату из указанной Вами статьи, которая бы подтверждала, что

Disallow: /?

действует так же, как

Disallow: /index.php?

ref
На сайте с 21.11.2004
Offline
91
ref
#25

Вот и получается, что задачка топикстартера средствами robots.txt в Яндексе не решается. Так что правильно пошел метатеги переписывать :)

Другой вариант структуру сайта (папки) формировать под возможности robots, но это не для описанного случая...

с уважением, Леонид
ref
На сайте с 21.11.2004
Offline
91
ref
#26
... что
Disallow: /?
действует так же, как
Disallow: /index.php?

Jackyk,

Частный случай, коль index - корень. Но, если ссылка на странице будет "/index.php?...", (вместо "/?...") имхо, пойдет робот по ей индексировать!

ultrabyte
На сайте с 28.01.2006
Offline
80
#27
Jackyk:
Все же не могли бы Вы привести прямо здесь конкретную цитату из указанной Вами статьи, которая бы подтверждала, что
Disallow: /?
действует также, как
Disallow: /index.php?

В этой статье нет явного указания на инструкцию Disallow: /?

тем не менее из того как обрезаются пути можно догадаться как работает disalow.

инструкцию disalow:/? мне так же давно подсказали знающие люди с этого форума.

когда была проблема, в индексе была куча страниц вида index.php?phpsessionid=12345

теперь в индексе только index.php

ultrabyte
На сайте с 28.01.2006
Offline
80
#28
ref:
Jackyk,
Частный случай, коль index - корень. Но, если ссылка на странице будет "/index.php?...", (вместо "/?...") имхо, пойдет робот по ей индексировать!

Нет не пойдет.

робот не пойдет дальше знака "?"

ref
На сайте с 21.11.2004
Offline
91
ref
#29
ultrabyte:
Нет не пойдет.
робот не пойдет дальше знака "?"

Вы в этом уверены??

Disallow: /?

и

Disallow: /index.php?

- имхо две разные инструкции.

Интерпретация robots Янд, имхо, достаточно примитивная: взял маску и вперед. Гугл хоть регул. выражения допускает. И то, видимо, приведенные инструкции и для Гугла будут разные. Или вы можете привести опровержение?

ultrabyte:

инструкцию disalow:/? мне так же давно подсказали знающие люди с этого форума.
когда была проблема, в индексе была куча страниц вида index.php?phpsessionid=12345
теперь в индексе только index.php

А на страницах вашего сайта ссылки стояли вида "/?..." или "/index.php?" ?

ultrabyte
На сайте с 28.01.2006
Offline
80
#30
ref:
Вы в этом уверены??

Disallow: /?
и
Disallow: /index.php?
- имхо две разные инструкции.

Интерпретация robots Янд, имхо, достаточно примитивная: взял маску и вперед. Гугл хоть регул. выражения допускает. И то, видимо, приведенные инструкции и для Гугла будут разные. Или вы можете привести опровержение?

А на страницах вашего сайта ссылки стояли вида "/?..." или "/index.php?" ?

1. да уверен.

2. по сути это одна и таже инструкция,

за исключением того, что, под disalow:/? отдаётся главная индексная страница.

Это может быть как index.php, так и index.asp index.pl или cgi и а также default.xxx, номе.xxx и любая другая индексная страница назначенная сервером.

3. ссылки на сайте были вида index.php?param=12345&param2=12345

сработала и работает инструкция disalow:/?

У гугля вся регулярка сводится к наличию *. хотя это тоже бывает иногда полезно.

хотя у гугла и богаче на звездочку *, язык определения в роботе.тхт,

суть инстукции disalow:/? ему не мешает. По крайней мере, до того как была прописана данная хрень, в гугле не было проблем с определением морды (с сессиями) как главной.

А в Яндексе их наплодилось, отсюда были проблеммы с вылетами морд, и с индексацией чужих ссылок.

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий