iseg

Рейтинг
80
Регистрация
15.12.2000
Должность
Search Engine Department Manager, Yandex
Интересы
Search Engine Development

Я говорю о "каталогах" (opendirectory, yahoo, looksmart), "базах предыдущих поисков" (directhit) и "базах объявлений по ключевым словам" (overture|espotting).

Для _всех_ таких поисковых источников фраза "primary results" в многочисленных табличках "кто-кому-дает-какие-результаты" означает следующее:

  • результаты поиска из этого источника занимают верхние позиции выдачи. Чаще всего 3-5-10 и ссылка "еще". Иногда результаты из primary-источника "идут, пока не кончатся", иногда помещаются в отдельный "таб"
  • обычно эти результаты отделятся от других источников. Реже замешиваются: для "объявлений" это сейчас явно запрещено, для остальных источников иногда встречается. В частности, directhit на hotbot-е замешивается
  • они выдаются только при условии, что в них что-то найдено. Вероятность нахождения запроса в этих источниках колеблется в интервале 5-35%.

Directhit на Hotbot-е выдавался, выдается и может теоретически выдаваться в 10-20 процентах случаев (навскидку). То, что он замешивается в верх выдачи, не отменяет факта, что Hotbot был, есть, и, как показали мои наблюдения, остается флагманским поиском Inktomi.

Илья

Как писал wolf
Оба-на! Еще один невежливый яндекс-робот! Опять яндексоиды лажанулись.

Скорее все же robots.txt был написан с ошибками (или его не было) на момент индексации.

На наш парсер robots.txt я не грешу, он за 5 лет эксплуатации вылизан до невозможности.

Как писал wolf
Видимо, по достаточно редким запросам, когда ни DMOZ, ни DirectHit не находят подходящих документов, результаты Inktomi появляются уже с первой страницы.

Каталог обычно покрывает примерно 30-35% запросов. Поэтому к словам primary|secondary results надо относиться с пониманием и осторожностью. В большинстве случаев primary|secondary обозначает не обшее доминирование, а всего лишь расположение на странице.

Запушен в апреле 2000-го года.

Как ответ ход поднимавшимся в то время Google и Fast, имевшим аналогичный "сверх-простой" дизайн. Падению популярности альтависты не помог.

Первые года полтора функционировал на собственном домене. В прошлом году (или в начале этого - не помню :)) альтависта в нем разачаровалась и сделала простым редиректом, после чего Raging окончательно потерял популярность.

Илья

Спасибо всем огромное!

Столько приятных слов (по совести говоря большую их часть

надо относить не столько ко мне сколько к окружающим меня людям)

Насчет сюрприза не уверен, текучка все больше заедает.

Да и откуда он возьмется - сюрприз?

Сайт "детей марии" www.mariaschildren.org(.ru). Не хватает рук

его вести так, что там все довольно старенькое.

Еще раз всем спасибо!

Однако на большинстве запросов в HotBot-е все еще появляется

Powered by Inktomi и результаты полностью идентичны search.positiontech.com

Пример запроса: russian ISPs

Как писал vmegap
1. Количество СПАМА в ящике прямо пропорционально длинне адреса.

4 буквы.

Вся почта - 100% спам.

Примерно 70 писем в день.

2. Каким-то мифическим способом на количестве спама влияет первая буква адреса. Чем ближе она к концу английского алфавита, тем меньше поток спама в ящике.

Еще бы. Рассылочные программы построены на обычных БД.

Рассылка идет по алфавиту в 95% случаев.

Повторы детектируются сервером начиная с некоторого порога.

3. Хотмейл предлагает несколько степеней фильтрации/QUOTE]

Я не помню, какую выставлял (средняя?).

Говорю сейчас про соотношение писем в bulk mail к inbox
для моей текущей настройки. Она бесплатная.

Два предыдущих года было 1:2.
Сейчас стало 5:2

Илья
Как писал funsad
отсеять большинство спамерских писем

Саша, не все так радужно, пока удается отсеять примерно около половины. :(

На личном ящике у меня счет 3:0 (то есть 3 отсеялось)

На другом (коллективный, широко известный западным спаммерам) ящике: вчера 4:1, сегодня 3:3.

В причины вдаваться не буду. :)

Кстати, Hotmail это практикует давно - года два, как минимум.

Причем в последние месяцы у них улучшился алгоритм. Раньше отсеивали процентов 30, сецчас около 60. Это я точно знаю, у меня там логин короткий и спама очень (!) много сыпется.

Кстати, мы немного модифицировали супершингл Бройдера, чтобы короткие письма лучше ловить, может еще накропаем статеечку куда-нибудь :)

Илья

...
Как писал Nicon
1. Большинство поисковиков с пониманием относятся к этому тэгу;

?

Кроме Рамблера и нас никто и знать о нем не знает. IMHO.

С опозданием присоединяюсь.

Успехов во всех областях!

Спасибо за сайт... :)

Илья

Всего: 442