robots.txt - запрет параметров

12
G2
На сайте с 30.11.2004
Offline
84
994

Ситуация буквально следующая:

есть страничка 123.php со скриптиком, который выдаёт следущие параметры:

123.php?id=1

123.php?id=2

и т.д., которые я не хочу чтобы индексировали поисковики.

Если я напишу в robots.txt

---

User-Agent: *

Disallow: /123.php?

---

будет ли индексироваться 123.php просто?

И ещё можно усложнить задачку, если много подобных страниц, то проканает ли такая строчка в robots.txt

---

User-Agent: *

Disallow: /*.php?

---

Надеюсь понятно выразился. Спасибо.

Гроссмейстер
На сайте с 15.01.2005
Offline
104
#1

Как я понимаю, корневая страница должна быть проиндексирована, а её производные - нет. Попробуй вставить в head строчку <meta name="ROBOTS" content="index,nofollow">. Это работает не со всеми пауками, но хуже от этого точно не будет.

По теме предлженных вариантов с "123.php?" я несколько сомневаюсь, так как, ИМХО, маска файла не распознаётся поисковыми системами.

Андрей Муравьёв Временно заброшенный блог: «Заметки интернет-маркетолога (http://web-blog.ru/)» «Чтобы задать правильный вопрос, нужно знать большую часть ответа» © Цицерон.
G2
На сайте с 30.11.2004
Offline
84
#2
Как писал Гроссмейстер
Как я понимаю, корневая страница должна быть проиндексирована, а её производные - нет. Попробуй вставить в head строчку <meta name="ROBOTS" content="index,nofollow">. Это работает не со всеми пауками, но хуже от этого точно не будет.

Так ведь на страничке помимо производных есть и нормальные ссылки, по которым надогулять. Такой вариант не очень подходит.

[Удален]
#3
Если я напишу в robots.txt
---
User-Agent: *
Disallow: /123.php?
---

будет ли индексироваться 123.php просто?

Будет.

И ещё можно усложнить задачку, если много подобных страниц, то проканает ли такая строчка в robots.txt
---
User-Agent: *
Disallow: /*.php?
---

Не проканает.

Надо отдельную строчку для каждого скрипта.

Гроссмейстер
На сайте с 15.01.2005
Offline
104
#4
Как писал glad2k

Так ведь на страничке помимо производных есть и нормальные ссылки, по которым надогулять. Такой вариант не очень подходит.

Если 123.php индексный файл, то всё понятно, а если нет, то я Вам рекомендую воспользоваться картой сайта, исчезнет эта проблема, а так же увеличится скорость переиндексации сайта.

G2
На сайте с 30.11.2004
Offline
84
#5
Как писал Interitus

Не проканает.
Надо отдельную строчку для каждого скрипта.

Как мне решить тогда мою проблему? Если у меня таких странич тысячи? Мне надо как то надо задать маску.

Все страницы такого вида

file1.php

file2.php

file3.php

и тд и тп

Мне надо чтобы сами они индексировались, а их производные - нет.

@
На сайте с 09.12.2003
Offline
134
#6
Как писал glad2k
Мне надо чтобы сами они индексировались, а их производные - нет.

В роботс.тхт этого не сделать.

Как вариант, можно определять наличие переменных в URI и если они есть ставить на страницу

<meta name="ROBOTS" content="noindex,nofollow">

Но этого заголовка вроде бы не все боты придерживаются.

Можно так же определять бота по юзер агенту или айпи и если страница с параметрами отдавать 404. Этот вариант понадежнее, но и возни с его реализацией на порядок больше.

G2
На сайте с 30.11.2004
Offline
84
#7
Как писал @uthor

В роботс.тхт этого не сделать.
Как вариант, можно определять наличие переменных в URI и если они есть ставить на страницу
<meta name="ROBOTS" content="noindex,nofollow">
Но этого заголовка вроде бы не все боты придерживаются.
Можно так же определять бота по юзер агенту или айпи и если страница с параметрами отдавать 404. Этот вариант понадежнее, но и возни с его реализацией на порядок больше.

Как то это всё сложно для меня :)

Вообще ещё я не договариваю, что помимо производных, на эти страницах есть и нормальные ссылки, по которым надо гулять поисковикам, поэтому с метатегом трюк не прокатывает. А про 404, я нифига не понял ;)

Вот блин, замарочился...

@
На сайте с 09.12.2003
Offline
134
#8
Как писал glad2k
помимо производных, на эти страницах есть и нормальные ссылки, по которым надо гулять поисковикам, поэтому с метатегом трюк не прокатывает.

Пусть себе ссылки остаются. Просто эти страницы индексироваться не будут.

Ставите в своем скрипте проверку наличия параметров в URI. Если они есть, то выводите вышеуказанный meta.

Т.е. на странице page.php этого тега не будет, а на page.php?a=1 будет.

G2
На сайте с 30.11.2004
Offline
84
#9
Как писал @uthor


Пусть себе ссылки остаются. Просто эти страницы индексироваться не будут.
Ставите в своем скрипте проверку наличия параметров в URI. Если они есть, то выводите вышеуказанный meta.
Т.е. на странице page.php этого тега не будет, а на page.php?a=1 будет.

Ещё бы уметь это реализовывать 🙄

tester999
На сайте с 21.10.2004
Offline
149
#10
Как писал glad2k


Ещё бы уметь это реализовывать 🙄

$HTTP_SERVER_VARS[QUERY_STRING];

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий