Вопрос по роботс.txt

B
На сайте с 04.09.2007
Offline
105
644

Добрый день.

возникла проблема, на сайт начали приходить поисковые боты и исполнять скрипты создавая нагрузку на сервер и ложа его.

требуется закрыть урлы такого типа:

index.php?action=ADD_TO_COMPARE_LIST

index.php?action=ADD2BASKET

в общем закрыть все урлы типа index.php?action

матчасть изучал, но боюсь закрыть что-то нужное

помогите плз

дешевые авиабилеты (https://www.avia-tickets.by/) для самостоятельных путешествий (http://samostoyatelnye-puteshestviya.ru/).
kimberlit
На сайте с 13.03.2007
Offline
370
#1

User-agent: *

Disallow: /index.php?action

B
На сайте с 04.09.2007
Offline
105
#2

до этого долго искал в инете что-нить подобное, но на всех cms bitrix(а на сайте стоит она)

видель лишь подобное

Disallow: /news/news/index.php?detail=1&ID=1043&print=Y

т.е. прямой путь к проблемному урлу (в смысле к тому который нужно закрыть от индексации)

если кто-то сталкивался с таким, не подскажете не возникнут ли проблемы?

остальные урлы выглядят следующим образом:

/index.php?SECTION_ID=151&ELEMENT

kimberlit
На сайте с 13.03.2007
Offline
370
#3

bankirfans, какой путь есть на самом деле такой и пиши ... Или покажи конкретный адрес ...

DrDeN
На сайте с 26.05.2008
Offline
50
#4

А если надо закрыть от индексации папку?

User-agent: *

Disallow: /папка/папка/

Эффективные GIF-Баннеры по 6$ (/ru/forum/384161) // Портфель NEW (http://drden.ru/portfolio/) (Зеркало (http://www.free-lance.ru/users/drden)) // Магазин готовых баннеров (/ru/forum/286804)
B
На сайте с 04.09.2007
Offline
105
#5
DrDeN:
А если надо закрыть от индексации папку?
User-agent: *
Disallow: /папка/папка/

если это был вопрос, то ответ да ))

kimberlit
На сайте с 13.03.2007
Offline
370
#6
DrDeN:
А если надо закрыть от индексации папку?
User-agent: *
Disallow: /папка/папка/

Закроется вторая только ...

DrDeN
На сайте с 26.05.2008
Offline
50
#7

Спасибо, то что надо.

B
На сайте с 04.09.2007
Offline
105
#8

ситуация не разрешилась, файл роботс.тхт следующий:

User-agent: *

Disallow: /bitrix/
Disallow: /auth/
Disallow: /personal/
Disallow: /personal/index.php?login
Disallow: /catalog/index.php?action
Disallow: /index.php?action
Disallow: /catalog/accessories/index.php?action
Host: www.begenius.ru
User-Agent: Yahoo! Slurp
Disallow: /
User-agent: msnbot
Disallow: /

однако логи показывают что роботы всёравно ходят по страницам которые запрещены в роботсе.

38.99.13.124 - - [08/Jan/2009:15:09:55 +0300] "GET /auth/?auth=yes&backurl=%2Fcommunication%2Fforum%2Findex.php%3Fbackurl%3D%252Fcommunication%252Fforum%252Findex.php%253FPAGE_NAME%253Dlist%2526FID%253D24%26PAGE_NAME%3Dlist%26FID%3D24 HTTP/1.0" 200 6290 "-" "Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)"

38.99.13.124 - - [08/Jan/2009:14:38:44 +0300] "GET /personal/index.php?login=yes&backurl=%2Fcatalog%2Fipod%2Findex.php%3Faction%3DADD_TO_COMPARE_LIST%26id%3D275%26SECTION_ID%3D168 HTTP/1.0" 200 6426 "-" "Mozilla/5.0 (Twiceler-0.9 http://www.cuil.com/twiceler/robot.html)"

66.249.71.233 - - [08/Jan/2009:14:38:14 +0300] "GET /catalog/accessories/index.php?action=ADD_TO_COMPARE_LIST&id=451&SECTION_ID=156 HTTP/1.0" 200 10175 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)"

как такое побороть?

kimberlit
На сайте с 13.03.2007
Offline
370
#9

Для начала пустую строку сделай между секциями ...

B
На сайте с 04.09.2007
Offline
105
#10

подправил, проблему не решило

10 минут максимум и

503 Service Temporarily Unavailable

причём грузит долбанный yahoo slurp который вообще не должен заходить на сайт

72.30.161.223 - - [08/Jan/2009:16:48:21 +0300] "GET /catalog/ipod/index.php?action=ADD2BASKET&id=1047&SECTION_ID=168&ELEMENT_ID=1047 HTTP/1.0" 302 19604 "-" "Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)"

bankirfans добавил 08.01.2009 в 17:14

вот нашёл на похожем магазине роботс:

User-agent: Yandex

Disallow: /*index.php
Disallow: /*PAGEN_100=
Disallow: /*sort=
Disallow: /*filter_price
Disallow: /*SAP_filter
Disallow: /*SELECTION_ID
Disallow: /*XID
Disallow: /*print
Disallow: /admin/
Disallow: /bitrix/
Disallow: /cat/compare.php
Disallow: /cat/detail_pictures.php
Disallow: /flash/
Disallow: /forum/
Disallow: /help/gifts/
Disallow: /img/
Disallow: /mobile/
Disallow: /personal/
Disallow: /search.php
Disallow: /search/
Disallow: /upload/
Disallow: /css/
Disallow: /scripts/
Host: www.eldorado.ru

есть несколько вопросов что запрещает от индексации строка Disallow: /*index.php ?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий