Проблема с Яндексом у новичка :(

12 3
Lioness
На сайте с 04.12.2003
Offline
111
2791

Здравствуйте, поможите, пожалуйста разобраться почему мы с Яндексом не сходимся :(((

Есть сайт www.sessia.net 30 ноября проходил робот

"GET / HTTP/1.1" 200 16882 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/user-registration.php?PHPSESSID=d7b08c61fb085e3a7759f098882d8672 HTTP/1.1" 200 17920 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/index.php?PHPSESSID=d7b08c61fb085e3a7759f098882d8672 HTTP/1.1" 200 16113 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/ HTTP/1.1" 200 16112 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/user-login.php?page=1&PHPSESSID=57c31b58aa2c4db9144ea9ae5b508dfa HTTP/1.1" 200 5569 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/user-registration.php?PHPSESSID=57c31b58aa2c4db9144ea9ae5b508dfa HTTP/1.1" 200 17920 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/admin/index.php?page=1&PHPSESSID=57c31b58aa2c4db9144ea9ae5b508dfa HTTP/1.1" 302 5 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /guestbook/index.php?PHPSESSID=57c31b58aa2c4db9144ea9ae5b508dfa HTTP/1.1" 200 16113 "-" "Yandex/1.01.001 (compatible; Win16; I)"

"GET /about.htm HTTP/1.1" 200 15877 "-" "Yandex/1.01.001 (compatible; Win16; I)"

И т.д., то есть пробежался по всем ссылкам на сайте, что уже хорошо :)))

Однако в роботсе прописано:

User-agent: *

Disallow: /cgi-bin

Disallow: /guestbook

Почему он лезет в guestbook?

И еще, при addurl Яндекс говорит Ваш URL http://www.sessia.net/ уже известен роботу Яndex. Данный ресурс будет доступен для поиска в ближайшее время.

Помогите, пожалуйста, а то у меня это продолжается не первый месяц :_(

Может я что-то не так делаю?:madd:

M
На сайте с 03.12.2003
Offline
0
#1

Советую тебе убрать PHPSESSID, они меня за это на три месяца выкинули из Яндекса

wolf
На сайте с 13.03.2001
Offline
1183
#2
Однако в роботсе прописано:
User-agent: *
Disallow: /cgi-bin
Disallow: /guestbook

Почему он лезет в guestbook?

Вообще, это элементарное свинство со стороны робота Яндекса. Оказывается, не только роботу "D" на robots.txt начхать, но уже и самому индексатору "I". Lioness, он перед тем, как забирать документы, вообще к robots.txt обращался?

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
Lioness
На сайте с 04.12.2003
Offline
111
#3

Wolf!

При запросе к robots.txt яндекс получает http code 200

Однако, я до этого писала в службу поддержки Яндекса, мне ответили что я неправильно написала файл роботса, при этом не объяснив в чем именно ошибка. Гостевую он все равно находил.

Месяц назад удалила роботс, тоже не помогло.

При всех вариантах (с роботсом и без) он видит ТОЛЬКО гостевую книгу, то есть индекс ему вообще не нужен :_(

До этого сайт был с меню навигацией на java, где-то прочитала, что он из-за этого не индексирует. Удалила яву - не помогло.

На индексе сделала ссылку на map - сейчас хоть видит все файлы, которые есть в директории.

Вообще ощущение, что я с этим Яндексом не совместима на генетическом уровне хнык-хнык :(

2 Malay

Я не знаю как мне это убрать, так как использовала готовый скрипт. Думаю надо будет другую гостевую ставить :(

2 All,

сорри, конечно, что глупые вопросы задаю, но что умела уже перепробовала. Ведь все остальные поисковики нормально все отображают.

Эх, сил моих девичьих больше нетути ...

wolf
На сайте с 13.03.2001
Offline
1183
#4
Однако, я до этого писала в службу поддержки Яндекса, мне ответили что я неправильно написала файл роботса, при этом не объяснив в чем именно ошибка.

Ну, не знаю, что было написано тогда, а сейчас директория guestbook действительно запрещена для индексирования:

http://kako.yandex.ru/cgi-bin/test-robots?host=http%3A%2F%2Fwww.sessia.net%2F

Когда была выложена текущая версия файла robots.txt?

Lioness
На сайте с 04.12.2003
Offline
111
#5

Эта версия роботса уже больше недели на сайте.

Однако все равно ведь в гест лезет :(

wolf
На сайте с 13.03.2001
Offline
1183
#6
Эта версия роботса уже больше недели на сайте.
Однако все равно ведь в гест лезет

Т.е. робот "I" лезет в директорию guestbook уже при наличии текущего robots.txt? Не могли бы Вы продемонстрировать тут (для чистоты эксперимента) строчки из логов, после того, как он полезет опять?

Polite Moose
На сайте с 22.04.2002
Offline
85
#7

В принципе, индексатор может пройтись по ссылкам отобраным заранее, тогда, когда robots не запрещал индексацию этих урлов.

Так же, есть еще вариант - для удаления запрещенных урлов робот их просматривает. В пользу этого говорит фраза из делурла "Ваш сайт/раздел ********** будет удален из нашей базы по мере обхода робота."

То есть для удаления робот должен обойти запрещенные области...

Удачи, доброго пива (http://www.fifth-ocean.ru/) и настроения! Релевантность определяется не тИЦ, не ВИЦ, не количеством ссылок, не частотой ключевого слова, а соответствием запросу!
wolf
На сайте с 13.03.2001
Offline
1183
#8
В принципе, индексатор может пройтись по ссылкам отобраным заранее, тогда, когда robots не запрещал индексацию этих урлов.

Вообще-то, по-моему мнению, вежливый робот обязан сверяться с файлом robots.txt во время каждого своего очередного визита.

C
На сайте с 19.09.2001
Offline
120
#9
Вообще-то, по-моему мнению, вежливый робот обязан сверяться с файлом robots.txt во время каждого своего очередного визита.

Или, как робот Инктоми, который проверяет robots.txt после "забора" нескольких страниц.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
greenwood
На сайте с 08.09.2003
Offline
519
#10
И еще, при addurl Яндекс говорит Ваш URL http://www.sessia.net/ уже известен роботу Яndex. Данный ресурс будет доступен для поиска в ближайшее время.

http://www.yandex.ru/yandsearch?serverurl=www.sessia.net&text=%23url%3D%22www.sessia.net*%22

http://www.yandex.ru/yandsearch?text=%C0%E2%F2%EE%F0%F1%EA%E8%E5+%EA%F3%F0%F1%EE%E2%FB%E5+%E8+%E4%E8%EF%EB%EE%EC%ED%FB%E5+%F0%E0%E1%EE%F2%FB+&stype=www&nl=0

12 3

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий