robots.txt

12
Sower
На сайте с 30.12.2009
Offline
647
1734

Можно ли как-нибудь в несколько строк запретить индексирвать всё, кроме морды?

__________________Бесплатная накрутка ПФ: посещаемость, просмотры, переходы с поисковиков по ключевикам, итд.
__________________Все посетители живые, не боты. (http://livesurf.ru/promo/80271)
B
На сайте с 07.12.2009
Offline
42
#1
Sower:
Можно ли как-нибудь в несколько строк запретить индексирвать всё, кроме морды?


User-agent: *
Disallow: /
Allow: /index.php
Allow: /$

Примерно так.

Sower
На сайте с 30.12.2009
Offline
647
#2
bndr:

User-agent: *
Disallow: /
Allow: /index.php
Allow: /$


Примерно так.

сенкс, сейчас потестим

Главное чтоб он не полез в index.php?.....

siv1987
На сайте с 02.04.2009
Offline
427
#3

Наоборот надо

Allow: /$

Disallow: /

Fat Bear
На сайте с 01.12.2006
Offline
264
#4
siv1987:
Наоборот надо

Для google - пофиг. Для Яндекса - да, именно так и надо.

Открыть счёт в Capitalist ( https://capitalist.net/reg?from=e5707ff0c3 ). Виртуальные карты, USDT, банковские переводы, выплаты партнёрских программ.
O
На сайте с 20.10.2008
Offline
101
#5

Для гугл:

User-agent: *

Allow: /$
Disallow: /*
42
D
На сайте с 07.11.2000
Offline
219
#6
Sower:
сенкс, сейчас потестим

Главное чтоб он не полез в index.php?.....

Если главная - это именно /index.php (без параметров), тогда перестраховаться /index.php$

O
На сайте с 20.10.2008
Offline
101
#7
Dimka:
Если главная - это именно /index.php (без параметров), тогда перестраховаться /index.php$

так делать не надо!

D
На сайте с 07.11.2000
Offline
219
#8

судя из сообщения Sower "главное чтоб он не полез в index.php?....." - сделал вывод, что главная по адресу index.php и есть внутренние index.php?..

поэтому, только так:

User-agent: *

Allow: /index.php$

Allow: /$

Disallow: /

иначе, для /index.php?param - все другие предложенные варианты разрешат (не поленился и проверил правильность моего robots.txt в GWT)

siv1987
На сайте с 02.04.2009
Offline
427
#9
Масол:
Для google - пофиг.

Да, у гугла этот тупой анализатор, там у них не в порядке следования а в уровне вхождения.

Т.е.

точное вхождение в URL: A и D - приоритет у A. очередность неважна

наибольшее вхождение в URL: A - приоритет у A. очередность неважна

наибольшее вхождение в URL: D - приоритет у D. очередность также не играет роли.

Где A - Allow; D - Disallow; URL - URL

I

Disallow: /index.php

Allow: /index.php?page

/index.php?page=23 - разрешен

/index.php - заблокирован

II

Allow: /

Disallow: /index.php

/index.php?page=23 - запрещен

/ - разрешен

Хотя лучше все директивы Allow писать вначале, во первых нет смысла что-то разрешать, потом это же запрещать, во вторых - это делает запреты совместимы с остальными ботами которые понимают аллоу (с яндексом по крайней мере).

O
На сайте с 20.10.2008
Offline
101
#10

Ничего там нет тупого! Там всё чётко документировано.

Вот то, что написано выше, это не только оставляет сомнения, но иногда даже теряет логику. Зачем писать абы что?! :)

Каждый раздел robots.txt начинается с User-agent. отсутствие этой детали не даёт понять вам смысла в упорядочении Allow и Disallow.

Каждый новый раздел заставляет игнорировать значение предыдущего:

User-agent: *

Disallow: /katalog1/

User-Agent: Googlebot

Disallow: /katalog2/

В этом примере для поискового робота Googlebot будут запрещены только URL-адреса, включающие /katalog2/.

Allow: нужен в 90% в тех случаях, когда Disallow: перекрывает (или им просто легче перекрыть) целый каталог (или даже сайт), но исключив при этом некоторые URLы.

User-agent: *

Allow: /*?$

Disallow: /

В этом примере строка Disallow: / блокирует весь сайт целиком, начиная с корня, строка Allow: /*?$ (которая обязательно должна идти перед Disallow) разрешает доступ ко всем URL-адресам, оканчивающимся знаком вопроса, т.е. после знака ? нет никаких символов.

В примере I, если поменять директивы Allow, Disallow местами, то:

Запрещены все урлы, начинающиеся на /index.php, то же самое, что и /index.php* - звёздочка не нужна..

Разрешены только те, что после знака ? начинаются на page

В примере II лишний Allow и запрещены урлы с началом /index.php

Сам домен, к примеру, разрешён и много ещё чего разрешено, по сути...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий