Игнорирование robots.txt

12
mstar
На сайте с 19.12.2005
Offline
133
1018

В кеше и в выдаче яндекса есть туча ненужных страниц, которые закрыты от индексации в роботс.тхт

Страницы новые и были проиндексированы после закрытия их в роботс.тхт

User-agent: *

Disallow: /?action=freight&page=*

www.sit-trans.com/?action=freight&page=506&

Вопрос: почему яндекс их индексирует и игнорирует роботс.тхт?

Вопрос2: как бороться с яндексом в такой ситуации? может кто-нибудь знает оптимальное решение для яндекса?

Потому как таких страниц - в принципе очень много и они не несут никакого контента в себе.

Разработка сайтов (http://www.mstarproject.com/?action=tecdoc_mysql_site) - удобные веб приложения по разумной цене.
T.R.O.N
На сайте с 18.05.2004
Offline
314
#1

mstar,

http://www.yandex.ru/cgi-bin/test-robots?host=www.sit-trans.com

Научитесь писать роботс правильно!!!


User-agent: *

Disallow: /?action=freight&page=*
Disallow: /?action=transport&page=*
Disallow: /forum/*

Disallow: /forum/admin/
Disallow: /forum/db/
Disallow: /forum/images/
Disallow: /forum/includes/
Disallow: /forum/language/
Disallow: /forum/templates/
Disallow: /forum/common.php
Disallow: /forum/config.php
Disallow: /forum/faq.php
Disallow: /forum/groupcp.php
Disallow: /forum/login.php
Disallow: /forum/memberlist.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/privmsg.php
Disallow: /forum/profile.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php

Домашняя работа - 2. И родителей к директору =)))

От воздержания пока никто не умер. Хотя никто и не родился! Prototype.js был написан теми, кто не знает JavaScript, для тех, кто не знает JavaScript (Richard Cornford)
mstar
На сайте с 19.12.2005
Offline
133
#2

Спасибо конечно за оперативность, но может Вы еще и подскажете что в нем неправильно?

T.R.O.N
На сайте с 18.05.2004
Offline
314
#3

mstar,

Уважаемый, за это неуд вовсе!!!

Нельзя в блоке пустые строки оставлять!

mstar
На сайте с 19.12.2005
Offline
133
#4
T.R.O.N:
Нельзя в блоке пустые строки оставлять!

А не подскажете: переводы строк чем надо разделять? 13 или 1013?

На счет неуда: случайно заметил в выдаче, так как для гугла такой синтаксис вполне валидный.

T.R.O.N
На сайте с 18.05.2004
Offline
314
#5
mstar:
А не подскажете: переводы строк чем надо разделять? 13 или 1013?

А вот это - всеравно. Согласно формата plain/text сервера.

Для win - 1310. *nix - 13. Заливая по ftp как текст - сервер сам исправит.

T.R.O.N
На сайте с 18.05.2004
Offline
314
#6

mstar,

объясните смысл

Disallow: /forum/* и

Disallow: /forum/viewonline.php

и еще

Вы о директиве Host слышали?

А то потом опять чудеса могут быть

garamond
На сайте с 21.11.2006
Offline
84
#7

если есть clean URLs - то их тоже... в Disallow

Я даже не представляю, что должен сделать мой сын, чтобы я ему сказал, что в молодости я себе такого не позволял.
hcir
На сайте с 28.09.2006
Offline
150
#8

Вообще-то, насколько я помню, подстановочные символы (*) в robots.txt не поддерживаются кроме строки

User-agent: *

Отсюда, видимо, и чудеса с индексацией. Возможно, есть смысл исправить

Disallow: /?action=freight&page=*
Disallow: /?action=transport&page=*

на

Disallow: /?action=freight&page=
Disallow: /?action=transport&page=

и конечно

Disallow: /forum/*

на

Disallow: /forum/

после чего вся вот эта простыня уже не нужна:

Disallow: /forum/admin/
Disallow: /forum/db/
Disallow: /forum/images/
Disallow: /forum/includes/
Disallow: /forum/language/
Disallow: /forum/templates/
Disallow: /forum/common.php
Disallow: /forum/config.php
Disallow: /forum/faq.php
Disallow: /forum/groupcp.php
Disallow: /forum/login.php
Disallow: /forum/memberlist.php
Disallow: /forum/modcp.php
Disallow: /forum/posting.php
Disallow: /forum/privmsg.php
Disallow: /forum/profile.php
Disallow: /forum/search.php
Disallow: /forum/viewonline.php

wbr
[Удален]
#9

а за что форум в игнор-то?

имхо от форумов масса пользы

FishB1
На сайте с 15.10.2006
Offline
75
#10
Вообще-то, насколько я помню, подстановочные символы (*) в robots.txt не поддерживаются

Поддерживаются, но не всеми ПС.

Ну а конструкция "Disallow: url*" - это нечно странное, даже если бы все поисковики поддерживали символы подстановки, в ней небыло бы никакого смысла все равно.

С уважением, Евгений Г.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий