robots.txt и взрослый IPB форум

12
J3
На сайте с 19.05.2006
Offline
102
2544

Добрый день.

Имеется форум, которому несколько лет, но robots.txt так и не создан (о ужас).

Хочется запретить ботам индексировать некоторые странички, чтобы зря не грузили наш сервер. НО многие из этих страниц уже есть в индексах поисковиков - не "обидятся" ли роботы, что им закрыли доступ к некоторым страницам, которые раньше они спокойно индексировали, и не уйдут ли они после этого вообще с сайта? :rolleyes:

Т.е. сейчас есть скрипт1 и скрипт2, оба они в индексах поисковиков, тут я создаю роботс.тхт, где запрещаю скрипт2 к индексации. Роботы всё нормально поймут? Перестанут индексировать скрипт2, а скрипт1 продолжат индексировать?

Например хочу добавить:

User-Agent: *

Disallow: *act=Forward*# запретить отправлять тему на мыло.

Disallow: *&st=all*# не показывать ему топики целиком, а то есть большие топики

Заранее большое спасибо за ответы!

Kislov
На сайте с 29.04.2006
Offline
185
#1

Какие страницы запретите для индексации в роботс, такие он индексировать и не будет. Если запретите индексацию, к примеру страницы с профилем, то он её не проиндексирует, остальное должен скушать :)

kolobok74
На сайте с 29.01.2006
Offline
267
#2
j0k3r:
не "обидятся" ли роботы, что им закрыли доступ к некоторым страницам, которые раньше они спокойно индексировали, и не уйдут ли они после этого вообще с сайта?

Не обидятся и не уйдут.

FishB1
На сайте с 15.10.2006
Offline
75
#3
User-Agent: *
Disallow: *act=Forward*
Disallow: *&st=all*

Обидятся не обидятся, но только это изначально не правильно, т.к. такие конструкции понимают далеко не все роботы, например Яндекс не поймет. К сожалению индексацию IPB не довести до ума исключительно роботсом...

С уважением, Евгений Г.
J3
На сайте с 19.05.2006
Offline
102
#4

Kislov

Какие страницы запретите для индексации в роботс, такие он индексировать и не будет. Если запретите индексацию, к примеру страницы с профилем, то он её не проиндексирует, остальное должен скушать

Да-да, именно профили и хочу запретить к индексации.

НО не будет ли проблем с тем, что они уже проиндексированы, а тут я их запрещаю?

kolobok74

Спасибо!

FishB1

Обидятся не обидятся, но только это изначально не правильно, т.к. такие конструкции понимают далеко не все роботы, например Яндекс не поймет.

Не поймёт?

К сожалению индексацию IPB не довести до ума исключительно роботсом...

А как же быть, можете подсказать?

6666
На сайте с 10.01.2005
Offline
505
#5
j0k3r:
А как же быть, можете подсказать?

Разделы, которые не надо индексировать, сделайте видимыми только для зарегистрированных участников.

Каждое мое сообщение проверила и одобрила Елена Летучая. (c) Для меня очень важно все что Вы говорите! (http://surrealism.ru/123.mp3) .
The end
На сайте с 23.11.2004
Offline
138
#6
j0k3r:
Да-да, именно профили и хочу запретить к индексации.
НО не будет ли проблем с тем, что они уже проиндексированы, а тут я их запрещаю?

не будет.

Я уже как-то делился готовым инвижновским роботсом, но раз поиск по форуму юзать не все умеют...

Держите, короче http://forum.vetby.ru/robots.txt

Все проверено, все стреляет.

Singular Advertising (http://www.singular.by/).
FishB1
На сайте с 15.10.2006
Offline
75
#7
Не поймёт?

Нет, не поймёт.

не будет.
Я уже как-то делился готовым инвижновским роботсом, но раз поиск по форуму юзать не все умеют...
Держите, короче http://forum.vetby.ru/robots.txt
Все проверено, все стреляет.

А есть ли смысл в таком количестве директив, если можно обойтись двумя:

Disallow: /index.php?&act=

Disallow: /index.php&act=

Всё рано через act скрипт форума ничего полезного не выводит =). Да и директива хост не интересна никому, кроме Яндекса, её лучше вынести в секцию Яндекса...

А как же быть, можете подсказать?

Во-первых определить роботов в группу гостей.

А дальше зависит от версии IPB, у меня до недавних пор стояла 1.3 от Бэстфайлз и к ней есть роботс, да и создавался он как раз с целью вычистить весь мусор (за бардак внутри извиняюсь, но никак не думал его кому-то показывать =)). В принципе этот-же сейчас и для 2.1.7, но в каждую секцию + строчка "Disallow: /lofiversion". Закрывает от Гугля вообще всё лишнее (по крайней мере ничего лишнего замечено небыло). А вот с Яндексом сложнее - ссылки типа /index.php?showtopic=4064&view=getnewpost и т.д. индексирует прекрасно. Я их джава-скриптами закрывал, но всё равно в индексе много лишнего, хотя всё же разница ощутима - было 180 тыс. страниц, осталось 40 =).

Если будете брать этот - не забудьте host поменять =)

txt 3890.txt
J3
На сайте с 19.05.2006
Offline
102
#8

6666

Разделы, которые не надо индексировать, сделайте видимыми только для зарегистрированных участников.

Как раз хочу, чтобы все разделы индексировались.

The end

не будет.
Я уже как-то делился готовым инвижновским роботсом, но раз поиск по форуму юзать не все умеют...
Держите, короче http://forum.vetby.ru/robots.txt
Все проверено, все стреляет.

Спасибо большое! Именно чтобы узнать это я и создал топик.

FishB1

Нет, не поймёт.

Не поймёт - пропустит директиву.. или забанит всё?

А есть ли смысл в таком количестве директив, если можно обойтись двумя:
Disallow: /index.php?&act=
Disallow: /index.php&act=
Всё рано через act скрипт форума ничего полезного не выводит =). Да и директива хост не интересна никому, кроме Яндекса, её лучше вынести в секцию Яндекса...

У меня старая версия форума, там топики - index.php?act=ST&f=X&t=Y - например, через акт выводятся.. да и разделы тоже.

Во-первых определить роботов в группу гостей.
А дальше зависит от версии IPB, у меня до недавних пор стояла 1.3 от Бэстфайлз и к ней есть роботс, да и создавался он как раз с целью вычистить весь мусор (за бардак внутри извиняюсь, но никак не думал его кому-то показывать =)). В принципе этот-же сейчас и для 2.1.7, но в каждую секцию + строчка "Disallow: /lofiversion". Закрывает от Гугля вообще всё лишнее (по крайней мере ничего лишнего замечено небыло). А вот с Яндексом сложнее - ссылки типа /index.php?showtopic=4064&view=getnewpost и т.д. индексирует прекрасно. Я их джава-скриптами закрывал, но всё равно в индексе много лишнего, хотя всё же разница ощутима - было 180 тыс. страниц, осталось 40 =).

Гости у меня как раз ничего не видят, а ботам открыты топики, например.

Тогда вопрос так сформулирую - как правильно отменить индексацию профилей по ссылкам вида /index.php?act=Profile&MID=X

1) Disallow: /index.php?act=Profile

2) Disallow: *act=Profile*

?

The end
На сайте с 23.11.2004
Offline
138
#9
j0k3r:
Не поймёт - пропустит директиву.. или забанит всё?

Пропустит. Вопрос в том, чтобы "не поняли" а не "поняли неправильно".

j0k3r:
Disallow: /index.php?act=Profile
FishB1:
А есть ли смысл в таком количестве директив, если можно обойтись двумя:
Disallow: /index.php?&act=
Disallow: /index.php&act=
Всё рано через act скрипт форума ничего полезного не выводит =). Да и директива хост не интересна никому, кроме Яндекса, её лучше вынести в секцию Яндекса...

Все остальные просто пропустят директиву. А вот создавать в роботсе на форуме отдельные секции для разных роботов никогда смысла не видел.

FishB1:
А вот с Яндексом сложнее - ссылки типа /index.php?showtopic=4064&view=getnewpost и т.д. индексирует прекрасно.

Не индексирует. НЕ ИНДЕКСИРУЕТ, А ПРОХОДИТ. getnewpost - это 302-й редирект, по которому Яндекс проходит и индексирует уже сами страницы тем.

Я закрываю страницы, не несущие какой-либо ценности, lofiversion я не закрываю. ;)

edogs software
На сайте с 15.12.2005
Offline
775
#10
j0k3r:
Тогда вопрос так сформулирую - как правильно отменить индексацию профилей по ссылкам вида /index.php?act=Profile&MID=X
1) Disallow: /index.php?act=Profile
2) Disallow: *act=Profile*
?

Лично мы делали 301/302 редирект с "ненужных" ссылок на главную страницу сайта. Кое-где движком, кое-где mod_rewrite-ом. Ещё нам подсказывали вариант - движком на "ненужные" страницы выдавать меты по типу noindex, follow.

Разработка крупных и средних проектов. Можно с криптой. Разумные цены. Хорошее качество. Адекватный подход. Продаем lenovo legion в спб, дешевле магазинов, новые, запечатанные. Есть разные. skype: edogssoft
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий