iseg

Рейтинг
80
Регистрация
15.12.2000
Должность
Search Engine Department Manager, Yandex
Интересы
Search Engine Development

А что я должен был сказать людям, которые еще вчера называли Яндекс "плохой поисковой системой", а сегодня громко (мне пришло по подписке на запрос) продают свои услуги по выведению клиента на первое место в выдаче того же самого Яндекса?

Они предлагают такие услуги? Ради бога. Мы будем противодействовать им доступными нам средствами.

Илья

Как писал InSAn
Официальный комментарии от лица компании Mail.Ru можно будет получить в начале следующей недели

А, понял вашу мысль. Журналисты не могут написать ни о чем пока не получены официальные комментарии. Ведь для этого надо будет сочинить свой собственный текст. А как же это сделать без пресс-релиза? Они уже давно отвыкли.

Как писал InSAn
И "вылезла" она совершенно случайно :)

То есть Google там работает случайно? По ошибке? Или это все-таки нормальная эксплуатация? Или это бета-режим?

Ничего не понимаю.

Как писал NULL
Событие и для прессы и для пользователей mail.ru совершенно заурядное

Я вообщем-то согласен. Просто я представляю какие пафосные заголовки будут в наших изданиях, особенно после того как об этом напишет searchenginewatch.com

Удивляет молчание всей нашей компьютерной прессы.

Как писал Ashmanov
Я не знаю, какой у Вас опыт работы с правовыми базами данных

Вообще-то Макс делает Кодекс уже много лет. Ты конечно знаешь, что это такое. :)

не в рамках полнотекстового поискового движка

Очень трудно провести эти рамки. Порой.

Например, одно из самых важных свойств правовой базы данных - связь с предыдущими редакциями документа

Turtle анонсировал в свое время отслеживание процента изменения документов.

На последнем WWW в работе Манасси и Бродера показано как это делать экономно и корректно.

Нужно иметь теоретико-множественные операции над коллекциями документов и так далее. Поиск там не только по атрибутам, а смешанный, да и атрибуты сами довольно расплывчатые.

Это-то как раз несложно. И большинство поисков out-of-the-box это делают очень неплохо.

Вот Вам другой пример - двуязычный словарь

А поиск по whitepages? А поиск по yellow pages? А поиск по энциклопедиям, картинкам, товарам, в конце концов?

Ты думаешь там нет кучи эвристик по ранжированию, спец. предобработке данных

и т.д. и т.п.

А насчёт того, что в Интернете информации есть - это иллюзия. Там много дряни и неполных данных. В этом - проблема!

Зато там есть жизнь. Она конечно "дрянь". Но живая. :)

Нет нормальных энциклопедий, точнее парочка есть (Рубрикон, Британника), но большинству искалок они недоступны, а если и доступны (как в Яндекс-энциклопедиях), то ищется через них - плохо, потому что тут нужен именно словарный поиск (учитывающий поля и связи статей), а не интернетовский!

Там нужен нормальный поиск с грамотным ранжированием. Аккуратно настроенным под данные и выверенным. Именно такой мы и пытались делать. Тоже самое относится и к нашей работе над поиском в Lingvo.

Сравните поиск у нас и в Рубриконе. У нас и в Аббии.

Про Deep Web слышали? В "скрытом Интернете" вроде бы в 500 раз больше информации, но интернет-искалки её не могут видеть...

Опять же - на последнем WWW - приз за лучший постер получил Turbo10. Поиск в Deep Web.

Зато полно конференций, блогов, прочей рыхлой, грубой, сырой, неграмотной ерунды.

Во-первых, блоги блогам рознь. Некоторые очень даже ничего. Во-вторых, в них часто есть RSS - очень чистый формат.

Рамблер/Яндекс с Гуглом слегка помогают в этом, вот все и рады донельзя.

Дело не в радости. Поиск в сетке (той, которая "социальная") - это кусок нашей общей жизни.

В отличии от поисков в спец. коллекциях, которые нужны спец. людям, в спец. случаях.

С уважением,

Илья

Как писал spark
Кроме нескольких инфинитивов глаголы используются только для поиска по точной цитате и на кубках Яндекса

Все идем на dzen. И смотрим:

[Вот как это сделала блестящая художница Ольга Левенок]

[басист ищет группу]

[скачать драйвер для телефона]

[что надо сделать чтобы прорвало нарыв]

Еще? Или хватит?

Как писал IlVin
Неужели до сих пор паук бороздит РуНет из-под Win 3.1 ?

Nope. We use MS-DOS based systems.

Мои представления о цифрах

Как писал Ashmanov
Предположим, я хочу сделать отчёт о темперированной частоте упоминания наиболее известных политиков в региональных и центральных СМИ (я видел такой отчёт, сделанный руками за очень хорошие деньги).

Журнал Эксперт. Есть такой. Очень пафосный. По-моему ежемесячно вот уже несколько лет. Публикует этот рейтинг.

Ужасный бестолковый наколеночный бред.

Всего: 442