m7

Рейтинг
2
Регистрация
03.04.2002
Должность
Программист
Интересы
Поисковые системы

Для Spark:

Дык в том и дело, что новые алгоритмы в отличии от уже существующих рассчитывают и учитывают тот самый цифровой код, характеризующий личность пользователя.

>И поискали бы без революционных провокаций всяческих.

РЕВОЛЮЦИЯ (от позднелат. revolutio поворот, переворот), глубокие качественные изменения в развитии каких-либо явлений.

Так что в данном случае слово РЕВОЛЮЦИЯ подобрано семантически верно.

Originally posted by wolf:
Да и что тут говорить, если в списке достоинств поисковика, приведенных автором, отсутствует высокая релевантность.

1. Я руководил созданием этого проекта, но с сентября 2001 года я над ним не работаю.

2. В настоящее время я самостоятельно занимаюсь разработками новых алгоритмов, которые гораздо эффективнее уже внедренных, но даже внедренные все равно на несколько шагов дальше ушли от обычных поисковх систем.

3. Способ рассчета Формальной релевантности документов в этой системе может быть изменен в любой момент даже через веб-интерфейс.

Ответ для Sad Spirit:

>Если попробовать сделать тот же запрос в

>Рамблере/Яндексе/Апорте, которые, по Вашим словам,

>Лупе в пупок дышат, то результаты

>будут значительно более адекватны.

Лупа.Ру построена по совершенно новым принципам. Система постоянно обучается и развивается, пройдет немного времени и ситуация перевернется на 180 градусов.

>Тематическая направленность самых

>"релевантных" документов по изначальному

>запросу определяется на 100% точно: спам.

Из этой Вашей фразы следует, что Вы вообще не понимаете, что такое автоматичское определение тематической направленности документов и зачем это нужно.

P.S.

Вместо того, чтобы объективно разобраться, Вы пытаетесь работать на публику. Зачем Вам это ? Если и дальше так пойдет обсуждение, то у разработчиков не останется никакого желания придумывать что-то принципиально-новое.

Конечно, определять в автоматическом режиме тематическую направленность документов не всегда удается правильно, но , как видно, все ж процентов на 80% удается.

А многие люди говорили мне, что это вообще из разряда фантастики и принципиально не реализуемо.

К тому же система построена на принципах саморегулирования и с увеличением посещаемости системы и изменением содержания интернета каталог автоматически перестраивается.

Зато модерация каталога происходит в автоматическом режиме, и стоимость поддержки такой системы резко падает.

И это еще старая версия алгоритмов. К настоящему времени разработаны принципиально новые алгоритмы, по своим характеристикам на порядок превышающие текущую версию.

Конечно, конкретных алгоритмов я вам рассказать не могу (коммерческая тайна), но, проанализировав принципы, заложенные в -=www.Lupa.ru=- , вы сможете найти много интересных и полезных для себя идей.

M7

Если Вы, например, ищете работу в Москве, то после запроса РАБОТА попробуйте уточнить в региональном каталоге Москва и в тематическом РАБОТА и КАРЬЕРА.

http://www.lupa.ru/search.asp?P1=2830,2839&P2=3851,3852&P3=4272&Query=%u0440%u0430%u0431%u043E%u0442%u0430&page=1&filter=1

В том то и дело, что слово РАБОТА может быть использовано почти в любом контектсе, и это еще раз иллюстрирует, как важно иметь мощный механизм уточнения отчетов.

По запросу РАБОТА найдено 45 тысяч сайтов, т.е. ~ 40% от всех доступных. Так что этот запрос тестом назвать нельзя.

Originally posted by AiK:
ewspam
>За два с лишним года моего участия на этом >форуме я узнал о рождении двух поисковиков
>(не участвуй я на этом форуме, то и не знал >бы о них вовсе).

Значит ты вообще не в курсе ситуации.

Уже около 2 лет в России работает реальный проект -= www.Lupa.ru =- .

Это поисковая система, целиком интегрированная с самым большим каталогом ресурсов в рунете в 3 раза больше Яндекса ( более 114 тысяч сайтов ). Первый в мире поисковик, который стопроцентно предсказывает количество найденных ссылок в каждой из рубрик каталога ресурсов.

База там конечно не очень большая, но все ж больше Апорта.

Зато:

1. Оригинальный и быстрый движок

2. Интеллект на уровне лучших систем поддержки принятия решений

3. Генерация отчетов в XML и HTML виде

4. Практически линейная масштабируемость

M7

ewspam, спасибо !

euhenio:

>> Юзер <>(не равен) самому себе усредненному

Харакетиристики усредненного и неравного юзера могут увеличить релевантность в 2 раза (потому как сегодня вообще никакой не учитываетс).

>>"при разработке бурильных установок надо использовать железо

Если бы использовали, к примеру, дерево, а ты предложил бы железо и доказал, что это более выгодно, то тебе б цены не было.

wolf, мной разработаны конкретные механизмы (алгоритмы) реализации рассчета цифрового кода и учета этого кода для обеспечения более релевантногоь поиска. Но я не могу публиковать этот материал (иначе под что я получу инвестиции), поэтому конкретно это направление я могу обсуждать только с серьезными инвесторами.

Обмен данными между поисоковыми системами и пользователями уже сегодня можно использовать для выяснения основных интересов пользователя, его словарного запаса, интеллектуального уровня. Может, точность этих оценок не идеально (идеальным ничего быть не может), но эта точность поможет снизить среднее время поиска необходимых докуметов минимум в 2 раза, и я это могу доказать математически на основании проведенных мной исследований.

Я занимаюсь информационными технологиями более 15 лет. В этой сфере, как и в других, каждый должен быть специалистом своего дела. Мне неинтересно заниматься вопросами повышения эффективности взаимодействия между пользователями и между пользователями и поисковыми системами (системы вопрос-ответ).

Есть профессионалы, которым интересно заниматься инвестициями в разработку высокотехнологичных систем для последующего извлечения прибылей от эксплуатации этих систем.

Одной из важных целей подобных форумов я считаю знакомство специалистов и инвесторов. Это прежде всего полезно для пользователей - чем быстрее мы найдем друг друга, тем быстрее пользователи смогут воспользоваться новыми технологиями и сэкономить свое время.

С уважением, Михаил.

vmegap, я хотел привлечь к обсуждению специалистов.

Форум - одна из оптимальных форм обсуждения. Для меня основная цель обсуждения - выяснить слабые стороны предложенной мной модели системы для улучшения ее характеристик ( функциональный набор, алгоритмы для более точного рассчета формальной релевантности, увеличение скорости, снижение стоимости разработки, оборудования и эксплуатации ).

Если Вы специалист - прошу Вас изложить конкретные недостатки предложенной мной модели и методы их устранения. Если нет - прошу не загрезнять обсуждение неконструктивными сообщениями.

С уважением, Михаил.

12
Всего: 13