vs

Рейтинг
24
Регистрация
20.06.2001
Должность
разработчик

Рамблер индексирует очень неохотно, и очень медленно.

Только очень старые страницы и только если сайты хостятся в соседней комнате. С очень короткими урлами, в которых не более пяти разных символов.

Поищите развлечения ради запрос:

Rambler и длинные кривые адреса

Как писал wolf


Где объективное мерило рейтинга - что искуственно, а что естественно?

Ну, например, Cooper W.S. Expected Search length: A single measure of retrieval effiectieness on weak ordering action of retrieval systems, 1968

если надо, еще штук 50 объективных мерил можно найти. Поиском :-)

Если есть возможность - сделайте, чтоб он видел немного другой чат. Чтоб он видел свои постинги, а другие - нет. Что то вроде "волки сыты, а овцы - целы".

При отсутствии обратной связи жизнь, знаете ли, очень сильно усложняется. Особенно когда с сайтом работает не человек (он может увидеть странности), а программа.

Доступ - обратитесь в техподдержку, напишите зачем нужен и как собираетесь использовать. Мы предоставляем желающим заниматься IR доступ к XML ответной странице результатов поиска.

Как писал trink
Теперь нужно построить автоматический построитель тематической иерархии
Пробовал выделять кластеры из связаных с друг другом слов
Но результаты очень плохие
Думал построить связи между документами но не придумал пока достаточно быстрых алгоритмов
Подскажите какие нибудь идеи пожалуйста

Почитайте

http://www.almaden.ibm.com/cs/k53/clever.html

и

http://www.almaden.ibm.com/cs/people/dmodha/toric.pdf

если идея нравится - попробуйте сделать что-нибудь наподобие. Доступ к результатам поиска, хранилищу текстов и графу ссылок можем дать.

Как писал Tanys

а как вы определите автора творения?

Иногда нам это удается. Некоторые на этом форуме могут это подтвердить.

Забаним такой сайт и все остальные творения этого же автора.

а Вы найдите десять отличий :-))

он ранжирует немного по другому, быстрее работает.

Мы вместе с обновленной базой выкатили обновленный поиск. То, что сегодня с утра полчаса-час могут быть перебои, предвидели заранее, поэтому и выбрали пятницу перед праздниками, когда нагрузка поменьше и народ с утра празднует и интенсивно поздравляет милых дам.

Увы, не обошлось без досадных накладок со смешиванием основных результатов с top100 и общей стабильностью поиска - при следующих обновлениях такого брейк-данса быть не должно.

Картинка, которую сфотографировал Master99 - результат поиска, не прошедший через цитатор. Вчера ночью один из таких серверов погасили, запустили на нем обновление части базы, а потом по ошибке стартовали раньше времени. Бывает.

Думаю, что накручивать сайт, у которого DNS жив, сильно проще, чем сайт, который умер DBS. Скорее всего это залипание страниц сайта в кэшах или трафик с зеркал.

Всего: 129