Vyacheslav Tikhonov

Рейтинг
130
Регистрация
27.01.2001
Должность
Developer
Интересы
search engines, bots, information retrieval, data mining
Master's Degree in Computer Science

Эта тема уже на форуме обсуждалась.

Серега, с днем рождения! Главное, здоровья побольше, а со всеми начинаниями и продолжениямы мы поможем :)

1) оперативность обновлений индекса

Тут вообще сложно что-то новое придумать - алгоритмы все заезженные. Лечится только увеличением количества серверов :)

Как такового фильтра на ценность информации не существует. Я понимаю что оценка ценности информации достаточно сложная задача, но создание машины состоящей из нескольких выполняющих узкую специализацию это возможно.

В целом согласен. Но основная проблема здесь, скорее всего, в другом - для определения ценности информации статистические методы, на которых работают современные поисковики, не годятся. То есть частоту термов нельзя использовать в качестве меры их ценности.

Принципы должны быть другие - например, можно использовать лексические цепочки, но для этого уже нужны большие вычислительные ресурсы.

Вопрос 1 - необходимость.

Уже есть Яндекс, Рамлер и Google. Зачем нужен еще один поисковик?

Именно уникальными характеристиками.
Нужно создать то, что ни у кого нет в каком-то смысле нет .

Никогда не нужно забывать, что, с большой степенью вероятности, система с теми же свойствами где-нибудь создается или даже уже создана. :)

Вообще, чтобы не замусоривать этот топик, лучше сразу открыть новый и перенести обсуждение туда.

Определенно, еще одним гением на форуме стало меньше. :)

Крепкой и счастливой любви, Профессор!

А вообще есть идея создания, с финансированием, своего собственного поисковика.

А какой глубокий смысл в создании того, что уже давным-давно сделано?

Или в перспективе собственный поисковик обладает какими-то уникальными характеристиками?

А что имеется в виду под следящей информационной системой?

Это мониторинговая система (то есть news clipping) или нечто другое?

Всего: 847