Mark Adamenko

Рейтинг
16
Регистрация
02.07.2001
Должность
Менеджер по маркетингу Интернет проектов
Интересы
парашютный спорт, пиво, девушки, музыка и вообще активный отдых от компов

А как вообще сейчас можно попасть в Инктоми?

<font face="Verdana" size="2">Originally posted by Nicholas:
для индексирования объемных сайтов везде существуют особенные правила, со службами поддержки связывались?</font>

В Рамблере ответили стандартной отговоркой, что не индексируют динамический страницы(это было когда они вообще ничего не проиндексировали, а через несколько дней появилось первые 3 с лишним тысячи страниц - этот объем держится и по сей день), а в Яндексе ответили следующее:

<font face="Verdana" size="2">В принципе, с вашим сайтом все более менее нормально, но ... более 100000 URL'ов... Конечно, с марта мы их еще не обошли - как Вы пишите,
проиндексировано менее 4000 документов. И это закономерно. Ограничения на количество просматриваемых документов существуют. При каждом
заходе на сайт это прежде всего страницы, на которые чаще всего ссылаются, в основной своей массе неизменившиеся с последнего захода, и только
потом добираются новые, до сего момента неиндексируемые. Решение проблемы индексирования больших сайтов - установка на сервере поисковой
программы Яndex.Site (вторая версия) (http://www.comptek.ru/yandex/yansite.html) со специальным модулем, который отдает на индексирование только
изменившиеся (новые) страницы.
Честно говоря, для такого большого сайта, как Ваш, никакого другого разумного решения просто не просматривается. Впрочем, Вы предвосхитили наше
предложение, значит интересовались этой программой и сочли ее для себя непреемлемой. Возможно, Вы правы. Яndex.Site хорош для какого-нибудь
обобщенного магазина, владелец которого почему-то уверен, что общедоступный бесплатный сервис должен ежедневно менять ассортимент на его
полках. Ваш сайт статичен и основная проблема - проиндексировать его целиком.
Попытаемся "дедовскими методами", но Вы поймете, что это не выход.
1. Прежде всего "избавиться" от второстепенного контента - форумы, доски, архивы, статистика, версии на других языках, другие кодировки и т.д., закрыв
все это от индексирования с помощью файла robots.txt , оставив только собственно энциклопедии. Надо понимать, что всего перечисленного у Вас
неощутимо мало, если вообще имеется. В любом случае имеет смысл оставить для робота только "самое-самое"...
2. Создать на сайте несколько условных очагов индексирования, обычно это директории. Из каждого такого очага вручную через форму AddURL
добавлять по несколько десятков страничек. Если они уже есть в базе и дожидаются своей очереди на индексирование, это не сработает. Если
добавляются впервые, должно помочь. Самое главное - не перестараться, не саббмитить тысячами - иначе сработает антиспамовая программа и вообще
все запретит.

Вот, собственно, и все. Ничего иного пока не дано.
</font>

В Апорте к сожалению просьбу проигнорировали...

Я как-то на досуге занялся подсчетами - так вот получилось, что для полной индексации сайта потребуется более(!)... 4 лет!!!

1 234
Всего: 32