У нас оно уже примерно полгода есть - из
Searchengin-овых людей им пользовались Professor и еще кто-то.
http://search.rambler.ru/cgi-bin/rambler_xml?words=zzz
запрос и ответ - в UTF-8
лимиты - прмерно те же
там DTD и "прибамбасов" не хватает, но это дело наживное :-))
Да, можно и так, но ходить через окно неудобно - рядом есть дверь.
Есть addsite.cgi, который с минимальными задержками перекачивает сайт.
Нет, документы из быстрой базы ранжируются наравне со всеми. Более того, по однословным запросм они нечасто поднимаются наверх (ну, разьве что по запросу кукунадовечеромпосмотреть) потому, что ссылочный индекс обновляется с некоторой задержкой.
PageRank - он ведь TM и (R) и все такое. Поэтому PageRank может быть только у Google, причем по моим ощущениям, он там уже давно не совсем так считается, как написанов статье 1999 года.
Да, КП - это собственный вектор матрицы переходов графа ссылок, также как и большинство известных на данный момент алгоритмов оценки авторитетности страницы.
Так, давайте по порядку:
1) в быстрой базе каждое утро/вечер со всех URL, где есть счетчики, выбираются по N на сайт. Рассматриваются только новые страницы, которых в индексе еще нет. Первыми в N попадают наиболее посещаемые страницы. Ранжирование в построенной таким образом базе идет "как у всех".
2) При вычислении коэффициентов популярности данные top100 используются неявно. То есть КП != посещаемость top100.
В трех словах, учет топсты заключается в некотором "перекашивании" матрицы инцидентности графа ссылок. Данная операция обычно приводит к тому, что вероятность посещения страницы, расчитываемая таким способом, становится более похожей на правду. Для сайтов, соторых нет в топсте, перекашивание идет несколько иначе, на основании усредненных данных.
Приносим извинения за небольшую накладку, текст пресс-релиза находится здесь:
http://www.rambler.ru/db/news/msg.html?s=5&mid=3810592
А здесь - ответы на вопросы, которые в последнее время задавались на этом форуме и в нашей техподдержке:
http://www.rambler.ru/doc/faq2.shtml
И что, за все прошедшие с тех пор 2.5 месяца в логах нет приходов нашего робота?
Сейчас база Рамблера пополняется 2 раза в сутки - утром и вечером.
Из-за особенностей кэширования результаты поиска по некоторым запросам могут меняться с опозданием, но мы работаем над тем, чтобы задержку свести к нулю.
В очереди есть довольно много сайтов, которые не обновлялись 2-3 недели - подождите еще немного, у нас сейчас все время отнимает upgrade техники. Мы уже добавили в систему 15 серверов и в течение следующей недели планируем добавить еще 20.
Обычно это бывает если сервер нестабильно отвечает или кто-то балуется с robots.txt. Еще могла произойти переклейка дублей. Короче, спросите техподдержку.
ну, не знаю. Поищите
визит путина в малайзию
А Вам хотелось бы, чтоб про натяжные потолки? Извольте:
подсвеченные натяжные потолки с фотографиями известных фотомоделей