16 Апреля - День Информационной Революции

M7
На сайте с 03.04.2002
Offline
2
m7
#51

Конечно, определять в автоматическом режиме тематическую направленность документов не всегда удается правильно, но , как видно, все ж процентов на 80% удается.

А многие люди говорили мне, что это вообще из разряда фантастики и принципиально не реализуемо.

К тому же система построена на принципах саморегулирования и с увеличением посещаемости системы и изменением содержания интернета каталог автоматически перестраивается.

Зато модерация каталога происходит в автоматическом режиме, и стоимость поддержки такой системы резко падает.

И это еще старая версия алгоритмов. К настоящему времени разработаны принципиально новые алгоритмы, по своим характеристикам на порядок превышающие текущую версию.

Конечно, конкретных алгоритмов я вам рассказать не могу (коммерческая тайна), но, проанализировав принципы, заложенные в -=www.Lupa.ru=- , вы сможете найти много интересных и полезных для себя идей.

M7

wolf
На сайте с 13.03.2001
Offline
1183
#52

По запросу РАБОТА найдено 45 тысяч сайтов, т.е. ~ 40% от всех доступных. Так что этот запрос тестом назвать нельзя.

Да, нет, как раз-таки можно. И этот тест прекрасно демонстрирует полную неспособность данного поисковика противостоять даже простейшему виду спама - многократному повторению терминов в различных местах документа. Да и что тут говорить, если в списке достоинств поисковика, приведенных автором, отсутствует высокая релевантность.

Сергей Людкевич, независимый консультант, SEO-аудиты и консультации - повышаю экспертность SEO-команд и специалистов ( http://www.ludkiewicz.ru/p/blog-page_2.html ) SEO-блог - делюсь пониманием некоторых моментов поискового продвижения ( http://www.ludkiewicz.ru/ )
SS
На сайте с 31.08.2001
Offline
14
#53

Originally posted by m7:
По запросу РАБОТА найдено 45 тысяч сайтов, т.е. ~ 40% от всех доступных. Так что этот запрос тестом назвать нельзя.

Можно. Если попробовать сделать тот же запрос в Рамблере/Яндексе/Апорте, которые, по Вашим словам, Лупе в пупок дышат, то результаты будут значительно более адекватны.

Если Вы, например, ищете работу в Москве, то после запроса РАБОТА попробуйте уточнить в региональном каталоге Москва

Попробовал. Не понравилось: http://www.lupa.ru/search.asp?P1=2830&P2=3851,3852&P3=4272&Query=%u0440%u0430%u0431%u043E%u0442%u0430&page=1&filter=1 Куча ресурсов не имеет к Москве вообще никакого отношения. Уточнил по тематическому каталогу --- примерно та же картина: http://www.lupa.ru/search.asp?P1=2830,2839&P2=3851,3852&P3=4272&Query=%u0440%u0430%u0431%u043E%u0442%u0430&page=1&filter=1

Конечно, определять в автоматическом режиме тематическую направленность документов не всегда удается правильно, но , как видно, все ж процентов на 80% удается.

Тематическая направленность самых "релевантных" документов по изначальному запросу определяется на 100% точно: спам.

Зато модерация каталога происходит в автоматическом режиме, и стоимость поддержки такой системы резко падает.
Да уж, что модератора живого там нет, видно сразу.
M7
На сайте с 03.04.2002
Offline
2
m7
#54

Ответ для Sad Spirit:

>Если попробовать сделать тот же запрос в

>Рамблере/Яндексе/Апорте, которые, по Вашим словам,

>Лупе в пупок дышат, то результаты

>будут значительно более адекватны.

Лупа.Ру построена по совершенно новым принципам. Система постоянно обучается и развивается, пройдет немного времени и ситуация перевернется на 180 градусов.

>Тематическая направленность самых

>"релевантных" документов по изначальному

>запросу определяется на 100% точно: спам.

Из этой Вашей фразы следует, что Вы вообще не понимаете, что такое автоматичское определение тематической направленности документов и зачем это нужно.

P.S.

Вместо того, чтобы объективно разобраться, Вы пытаетесь работать на публику. Зачем Вам это ? Если и дальше так пойдет обсуждение, то у разработчиков не останется никакого желания придумывать что-то принципиально-новое.

M7
На сайте с 03.04.2002
Offline
2
m7
#55

Originally posted by wolf:
Да и что тут говорить, если в списке достоинств поисковика, приведенных автором, отсутствует высокая релевантность.

1. Я руководил созданием этого проекта, но с сентября 2001 года я над ним не работаю.

2. В настоящее время я самостоятельно занимаюсь разработками новых алгоритмов, которые гораздо эффективнее уже внедренных, но даже внедренные все равно на несколько шагов дальше ушли от обычных поисковх систем.

3. Способ рассчета Формальной релевантности документов в этой системе может быть изменен в любой момент даже через веб-интерфейс.

spark
На сайте с 24.01.2001
Offline
130
#56

Уважаемый m7, а вам не кажется, что не с манифестов, а с этого нужно было начинать? Я вот не разработчик, но и то понимаю, что разработчиков нужно лелеять, любить, общать между собой и хвалить, даже если пока не получилось.

Так нет, об эмпиреях каких-то порассуждать захотелось. Не любят здесь этого, любят свое слово во всех мыслимых поисковиках искать . И поискали бы без революционных провокаций всяческих.

M7
На сайте с 03.04.2002
Offline
2
m7
#57

Для Spark:

Дык в том и дело, что новые алгоритмы в отличии от уже существующих рассчитывают и учитывают тот самый цифровой код, характеризующий личность пользователя.

>И поискали бы без революционных провокаций всяческих.

РЕВОЛЮЦИЯ (от позднелат. revolutio поворот, переворот), глубокие качественные изменения в развитии каких-либо явлений.

Так что в данном случае слово РЕВОЛЮЦИЯ подобрано семантически верно.

Sergey Petrenko
На сайте с 23.10.2000
Offline
482
#58

Оказывается весь этот флейм был затеян ради промоушена очередного самого крутого поисковика рунета

Я же говорю - спам. За все время этот сайт, находясь на 4 месте по хорошему запросу - причем, получая с Рамблера и Яндекса по нему до 200 посетителей ежемесячно, - ни разу не получил оттуда хотя бы 3 человек в сутки. А первое место занимает страница, на которой строка запроса повторяется через каждые три слова.

Так что в данном случае семантически верно будет употребить слово ШАРЛАТАНСТВО.

[Удален]
#59

Originally posted by Gray:
За все время этот сайт, находясь на 4 месте по хорошему запросу - причем, получая с Рамблера и Яндекса по нему до 200 посетителей ежемесячно, - ни разу не получил оттуда хотя бы 3 человек в сутки. А первое место занимает страница, на которой строка запроса повторяется через каждые три слова.
Так что в данном случае семантически верно будет употребить слово ШАРЛАТАНСТВО.

А что за запрос-то? Интересно все-таки...

Алексей

vmegap
На сайте с 03.02.2002
Offline
158
#60

Originally posted by Gray:
Я же говорю - спам...
Так что в данном случае семантически верно будет употребить слово ШАРЛАТАНСТВО.

Идем на рекорд длинны флейма на данном форуме?

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий