Rambler-реванш

F
На сайте с 15.11.2000
Offline
116
1045

Недавно я где-то прочел, что команда Rambler-a, почувствовав клевок жареного петуха под именем Яндекс-Апорт, полгода назад взялась за разработку нового поискового движка. Запуск должен состояться в ноябре сего года. Кто-нибудь знает более подробную информацию?

[Удален]
#1

Давно пора, а то движок у них полный отстой

[Удален]
#2

Опа. А предыдущий топик я и не прочитал, как и ты наверное. Там человек с рамблера таки до нас дошел и кое чего сказал по поводу нового движка. Хочется надеятся, что движок оправдает ожидания, а то как то рамблер эти вопросы запустил. Он по сути был первым в свое время, а потом появился яндекс и апорт с новыми системами поиска, и рамблер как-то съехал вниз. В этом деле если уж вырвался на первое место, так уж нужно его держать. В общем семь футов под килтом

F
На сайте с 15.11.2000
Offline
116
#3

Originally posted by Kon:
В этом деле если уж вырвался на первое место, так уж нужно его держать.

Сроки в таких вещах сложно соблюсти -- вот и у рамблера с планируемого ноября на декабрь запуск перенесли (http://www.besplatno.ru/se/ubb/Forum4/HTML/000009.html). Давно пора. Если году этак в 98-м я при поиске пользовался Rambler-ом, а затем уже другими системами, чуть позже фаворитом стал Апорт, то сейчас в большинстве случае первым загружаю Яндекс, а к Рамблеру обращаюсь крайне редко.

[Удален]
#4

Абсолютно та же ситуация. Я тоже где то также от рамблера к яндексу перешел. И таких наверно большинство. В чем у них там была проблема, я не знаю. Может заняли первое место и расслабились, думали, что все так и останется. Или какие внутренние проблемы. А движок совершенствовать нужно постоянно. Конкуренция ведь.

Ashmanov
На сайте с 21.11.2000
Offline
66
#5

Насчёт жареного петуха:

петух клюнул раньше, когда в Рамблере продали контрольный пакет инвесторам в прошлом декабре. Тут-то и наняли в Рамблер новую команду, которая принялась разрабатывать новое поисковое ядро и другие штуки.

Команду эту из 15-ти человек привёл я, из компании МедиаЛингва, где я был гендиректором и акционером.

Ранее мы занимались искусственным интеллектом, электронными словари, машинным переводом, поисковиками, прочим. В частности, когда ваш Word (если пользуетесь) подчёркивает красной волнистой чертой ошибки в русском тексте, это работает ОРФО - наших рук дело. Впрочем, как и Апорт!, Пропись, Контекст, Мультилекс, Следопыт, Либретто, Русская служба имён и пр. Может быть, какие-то из этих продуктов вам известны - ну, Апорт-то точно.

Но: новое ядро разработать непросто - оно должно заложить базу на ближайшие два года, самое меньшее, и выдержать рост нагрузки и объёма в 4 раза минимум. Сейчас его делает 7-8 человек программистов и ещё лингвисты. Сейчас оно почти готово, в декабре надеемся "выкатить", дальше новые бантики, фичи и прибамбасы будем выпускать по нескольку в месяц.

Главное направление - релевантность, распознавание темы документа, запрос на ЕЯ, прочий ИИ. Уже сейчас в промежуточной версии по релевантности мы приблизились к Яндексу и чуть больше отстаём от Апорта (по нашим внутренним тестам условная релевантность поиска у Р., Я., А. соответственно 0.90, 0.94, 0.99. Это относительные цифры, несколько завышенные в силу используемой методики, но завышенные равномерно и по ним можно судить о росте - в январе 2000 было 0.65, 0.86, 0.95 соответственно).

С новым ядром надеемся догнать и перегнать.

Игорь Ашманов.

С уважением, Игорь Ашманов Все для оптимизации (рассылка, сервисы): www.optimization.ru (www.optimization.ru) Сервис по созданию собственных поисковиков: www.flexum.ru (www.flexum.ru)
Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#6

Игорь, спасибо Вам за этот модуль в Ворде. Правда, на некоторые фамилии и названия он реагирует очень интересно

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#7

Кстати, Игорь, вопрос немного не по теме, но все же...

В мире есть несколько сервисов, предоставляющих доступ к статистике поисковых систем. Имеется в виду самые популярные запросы, количество запросов по определенному слову и т.д. Некоторые, как, например, WordTracker, даже прогнозируют посещаемость страницы, если она попала на первую страницу Альтависты по определенному слову. Насколько возможно получить доступ к такой статистике у нас, в частности, по Рамблеру? Имеются ли планы создания сервиса по образу мною упомянутых?

Ashmanov
На сайте с 21.11.2000
Offline
66
#8

1. Насчёт орфографии в Ворде - дело в том, что модуль был продан Микрософту в 1994 г., причём чохом и вместе с исходниками (всего за $100,000 за четыре модуля - спеллинг, тезаурус, стилистический корректор и переносы). Я тогда был руководителем разработок в Информатике, а в 1995 уже открыл МедиаЛингву. Разработка ОРФО вяло велась и дальше, но в составе MS Office

с тех пор, возможно, словарь и не обновлялся, потому что MS это в общем до лампочки. Есть галочка, что есть спеллер и прочее для русского - и ладно. Таких "фич" в Ворде ещё 500, так что они не берут в голову. При покупке они устроили придирчивый тендер, наняли "чёрного оппонента", где мы выиграли с большим отрывом от Прописи и Houghton Mifflin, а потом они выбросили качество проверки из головы.

2. Насчёт статистики. Мы пока закрыли даже ежедневный список наиболее частых запросов, потому что его использовали спаммеры (всякие "секс, порно, рефераты, гороскоп, линукс, карта Москвы"). Здесь действительно идёт борьба - для некоторых держателей сайтов поисковик - это средство раскрутки, для нас - же главное релевантность. Ну, это объяснять не нужно.

В принципе, мы собираемся публиковать статистические отчёты и по Тор100 и по поиску; я думаю, где-то в 1-2 квартале 2001 мы встроим публикацию статистики по находимости и кликабельности конкретного URL в результатах поиска. Будем также показывать и ссылочный индекс. Что ещё - пока не знаю.

А спаммеров я рассчитываю просто распознавать по семантическому образу "мусорного" сайта, так что знание частых слов помогать перестанет.

Игорь Ашманов, Рамблер.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий