Яндекс перестал забирать html-и

12
R
На сайте с 06.11.2003
Offline
11
863

Яндекс перестал "нормально" индексить сайт: забирает роботом P только robots.txt, изредка роботом M одну-две страницы...

С другой стороны начал забирать довольно много картинок (тоже P).

Всего яндекс знает 2к страниц на сайте, страницы нормально находятся в его поиске.

Два месяца назад я закрыл в robots.txt довольно много из того что знает яндекс (для того чтоб он обратил свое внимание на новые страницы), но Яндекс вообще не забирает новье, и не заходит на старье.

Это беспокоит - сайт новостной и довольно критично чтоб находились новые страницы. Да и многих "старых" страниц, про которые помнит яндекс, уже не существует по старым адресам.

Есть какие-то идеи почему яндекс так игнорит мой сайт?..

Dr.Slash
На сайте с 12.04.2004
Offline
32
#1

Вы конечно учли что, что если вы закрыли в роботсе что то, то Янд. обязательно их сотрёт из своей базы...

Т.е. он их не просто теперь не смотрит, для него их просто нет.

Занятия х****й на рабочем месте развивают боковое зрение, слух и бдительность в целом!
R
На сайте с 06.11.2003
Offline
11
#2

я этого и добиваюсь - чтоб яндекс забыл про не столь существенные страницы в зачет более важным.

Но

а) в robots.txt закрыто далеко не все из того что ему было известно

б) он совершенно не ест новые страницы - вот что самое тревожное....

Я могу скриптом поудалять все страницы, которые ему известны и которые я не хотел бы чтоб были известны. Но опасаюсь что яндекс все равно не станет есть новые - если проблема в чем-то другом. И тогда трафик с яндекса вобще пропадет...

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#3

тогда позаботьтесь о том, что бы яндекс видел ссылки на новые страницы (скорее всего редко переиндексируется страница их содержащая) ...

R
На сайте с 06.11.2003
Offline
11
#4

ссылки на новые страницы в количестве есть на главной странице - сайт новостной. Ссылки "прямые" (чистым хтмл), ведут на статические страницы.

И еще: недавно (пару месяцев назад) появилось пару новых разделов, на эти разделы есть ссылка с каждой страницы сайта.Яндекс до сих пор не знает даже про главные страницы этих разделов.

Такое впечатление, что по какой-то причине Яндекс не хочет забирать ни одной новой страницы.

Может имеет таки смысл удалить из его базы пару страниц из тех что ему известны, в надежде что тогда он взамен возьмет новые?

R
На сайте с 06.11.2003
Offline
11
#5

Забыл сказать: главная страница обновляется каждые 5 минут (скриптом делается touch index.html)

Т.е. причина не в том что страница не обновляется и потому яндекс ее не забирает повторно. Да и он даже не пытается узнать менялась она или нет - забирает только robots.txt и кучу картинок.

Возможно, я намудрил в robots.txt, хотя очень внимательно его составлял. Но другие поисковики (рамблер, гугль, все остальные) нормально все смотрят...

E
На сайте с 09.06.2003
Offline
96
#6

Не хочеться делать неправильных выводов, но... Пытаюсь зарегить сайт в яндексе. Каждый дено выдает: ваш сайт внесен в базу и скоро будет проиндексирован. Уже неделю. Короче не хочет индексить. Подозреваю что связано это с last-modified тоже.

Приходят какие-то странные боты: ya-out.yandex.ru - что это такое.

Поиск книг в интернет магазинах (http://bookza.ru)
S
На сайте с 04.02.2004
Offline
37
#7

У меня тоже с Яндексом проблема... Смотрю "глазами Яндекс на страницы" - тайтл нормально выдается, а в результатах поиска стриница без тайтла. как это исправить???

Дата индексации (насколько я понимаю - это она) стоит за 06.11.2003...

Вопрос: почему яндекс не хочет переиндексировать главную страницу???? - это для меня загадка!!! И что делать? Просто ждать???

wayfarer
На сайте с 28.12.2003
Offline
141
#8

riderua, робот Р это картинщик и собирает он только картинки, а когда у Вас последний раз был робот I и что он смотрел?

Предпочитаю наличку
R
На сайте с 06.11.2003
Offline
11
#9

wayfarer, у меня лог ротейтится каждодневно, заходов "I" вообще не видно. Я убрал ротейт, сразу скажу как появится.

Есть логи вебалайзера - в них не все, а только верхушки по разным параметрам.

Обратил внимания что до июля включительно роботы

ya-out.yandex.ru

ghad-out.yandex.ru

slovo-out.yandex.ru

забирали в месяц 3-5 тыщ страниц, а в августе их в вебалайзере вообще не видно. Т.е. меньше тысячи каждый забрал точно...

а в сентября slovo-out.yandex.ru уже сделал 717 хитов, но забрал только два файла на сумму в один килобайт (терминология вебалайзера).

И если весной соотношение hits к files было один к одному, то в июле уже 2 к одному. Очень похоже что начали работать not-modified (я их включил в начале лета), но работать как-то очень-очень неправильно :(((

R
На сайте с 06.11.2003
Offline
11
#10

за четыре дня первый раз зашел робот "I", забрал robots.txt

Я более четко сформулировал свою проблему: яндекс не забирает новые страницы уже на протяжении 2-х месяцев.

Остальное нормально: хорошо обновляется (и находится в Я) то, что у него уже есть.

Есть какие-то идеи из-за чего такое может быть?

Любая свежая мысль очень поможет!...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий