Нигма

1 234
JR
На сайте с 22.03.2005
Offline
263
#21

Kryukov, ну и как обработка? какую зверушку еще ждать интересную? :)

MaulNet
На сайте с 07.08.2005
Offline
348
#22

Kryukov, и как - быстро индексирует? У меня рекорд - чуть менее года, а у вас? :)

K
На сайте с 11.11.2005
Offline
12
#23
MaulNet:
Kryukov, и как - быстро индексирует? У меня рекорд - чуть менее года, а у вас? :)

По черепашьим меркам это, можно сказать, мухой :) Я хорошо отношусь к приколам.

а в базе пока 200 млн. документов.

Если вы будете следовать инструкциям, то каждое блюдо будет получаться у вас таким же, как и у нас, даже если раньше вы никогда не занимались приготовлением пищи. Поваренная книга Мак-Колла и эпиграф Д. Кнута (http://www.turtle.ru/)
M
На сайте с 29.03.2003
Offline
65
#24

Есть еще одна деталька в продвижении Нигмы: использование бренда МГУ, а именно "... создана двумя факультетами МГУ: психологии и ВМиК"

У Вебальты такого нет.

Проверь свои запросы: Вершки Рунета (http://www.43n39e.ru/)
MaulNet
На сайте с 07.08.2005
Offline
348
#25

Maxime, ну дак самостоятельные. :)

M
На сайте с 29.03.2003
Offline
65
#26

Ага, ежели ещё учесть, что Гугл сразу позиционировался как детище студентов Стэнфорда... :)

A Яндекс чуть ли не в каждом втором интервью задвигает, что большинство его ведущих сотрудников грызло науку чуть ли не на уровне РАН.

И у Гугла и у Яндекса куча научных статей выходило и выходит на тему технологий поиска.

Самое время Вебальте рассказать, кто ж такие их девелоперы :D На каких научных работах это всё основано. Вот раскажут ли - вот в чём вопрос 🙄

S
На сайте с 17.10.2005
Offline
17
#27
Maxime:
Ага, ежели ещё учесть, что Гугл сразу позиционировался как детище студентов Стэнфорда... :)
A Яндекс чуть ли не в каждом втором интервью задвигает, что большинство его ведущих сотрудников грызло науку чуть ли не на уровне РАН.
И у Гугла и у Яндекса куча научных статей выходило и выходит на тему технологий поиска.

Самое время Вебальте рассказать, кто ж такие их девелоперы :D На каких научных работах это всё основано. Вот раскажут ли - вот в чём вопрос 🙄

Построить поиск среднего качества не так сложно. Будь то Вебальта или другой бренд. Теория информационного поиска существует уже лет 50, и с тех пор придумали только ссылочное ранжирование. И то, и другое вещи открытые, публикаций много, поэтому никаких чудес не будет у кого бы то ни было. Здесь придумывать ничего не нужно, работы опубликованы. Сейчас самое важное - чистота коллекции. Сделать поиск по идеальному набору документов не составлет больших проблем. Но для того, чтобы эта коллекция была хоть сколь-нибудь нормальной, ее надо очистить от: дублей, дорвеев, накруток ссылочного ранжирования и т.п. Кроме того, понять какое именно железо поставить на каждый модуль работы поисковика: поисковые роботы, индексаторы и проч. Сейчас лучший поисковик - тот, у которого выдача "чище". Борьба за релевантность в чистом виде закончилась. Какая с точки зрения пользователя разница, когда по запросу "сеть химчисток" на 1-м месте сеть "Лисичка", на 2-м - "Диана" или наоборот. А вот если там дорвеев полный лес и дублей, и прочих прелестей, тогда это имхо плохая выдача.

M
На сайте с 29.03.2003
Offline
65
#28

У вас сильно упрощенно-наивный взгляд, этот "...с тех пор придумали только ссылочное ранжирование." :)

Список патентов в области поиска, а это не только ранжирование, но и упомянутая вами ловля дублей и поискового спама и др., публикоемый в одном блоге в виде краткий аннотаций весьма солиден (требует много сколировать вниз для просмотра всего :).

Поэтому далеко не всё, что опубликовано, можно запросто тащить в Вебальту без последствий судебных разбирательств :)

Ну и кому нужен очередной новый средний поисковик ? 😂

Перефразируя старую пословицу, таким макаром на проком Вебальты крошек поднять можно, но чтобы урвать хлеб с маслов в виде трети рынка нужно придумать что=-то новое. Ну и кто будет придумывать в Веб-альте, кто у них Думатель, где его предыдущие работы ?

S
На сайте с 17.10.2005
Offline
17
#29
Maxime:
У вас сильно упрощенно-наивный взгляд, этот "...с тех пор придумали только ссылочное ранжирование." :)

Я имел в виду поиск по "чистой коллекции".

Остальное, написанное вами - присоединяюсь полностью. Никому не нужен еще один средний поисковик, нужен лучше. А для этого нужны люди с соответствующим опытом и желанием работать в этом направлении. А патентов - да, масса. Кстати, как-то специалист из Google сказал очень значимую фразу на вопрос "пользуются ли они результатами конференции TREC". Он ответил "нет, т.к. все эти вещи уже давно замусорены спамерами". Пока достаточно спросить у Вебальты "Яндекс" - http://www.webalta.ru/search?q=%FF%ED%E4%E5%EA%F1&city=any , и качество поиска хорошо видно. Еще можно спросить "Рамблер" - http://www.webalta.ru/search?q=%F0%E0%EC%E1%EB%E5%F0&city=any

M
На сайте с 29.03.2003
Offline
65
#30

Простите, а что это был за "специалист из Google" ?

Дело в том, что сам Google со своим движком занял первое место в одном из прошлых TREC, а простой поиск по сочетанию TREC GOOGLE приносит список работ TREC2003 http://trec.nist.gov/pubs/trec12/t12_alpha.index.html , где есть статья Google, Inc. Partioning a Graph of Sequences, Structures and Abstracts for Information Retrieval, page 522

Выходит, что они не только используют, но и сами участвуют :)

1 234

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий