BION

Рейтинг
13
Регистрация
18.07.2008
Russeist:
Добрый день.

Подскажите, пожалуйста, хорошие книги или статьи объясняющие фундаментальные принципы работы ПС. Заранее спасибо.

Почитайте: Тоби Сегаран "Программируем коллективный разум". Очень интересная, а в одной из глав рассматривается пример разработки простой пс. И все на Питоне кстати!

dr_dax:
Откровенно неохото и лениво кому-то что-то доказывать, т.к. всеравно обговняют Постараюсь ответить кратко...

Я неплохо знаю как работают классические поисковики. и повторюсь у нас совершенно иная технология реализации. Больше всего это похоже на нейронную сеть, но это не она в классическом понимании...

Вобщем если кому то хочется пообсирать, то пожалуйста, я уже давно не обращаю внимания на это, если кто-то действительно интересуется, я готов к сотрудничеству. Есть что показать и рассказать.

Если все так уникально, есть уверенность и работающий прототип, может стоит попробовать поискать нужных людей!? "Неохота и лень" вам не помогут.

А для того чтобы не "гадили в душу", не будьте голословным - покажите. Все оценят.

RedStar:
Скажите, а Вы когда спрашиваете кого-либо, в ответ ожидаете получить перечень статей и книг, которые содержат ответ?
Что касается уточнений, назовите это доп.информацией, например, серия запросов: что такое Интернет, какие протоколы, количество хостов и т.д.

Соглашусь с Алексеем.

Вчера состоялся диалог с одним из Ваш ботов:

я: Who killed Kennedy?

q: I tend to believe that Oswald acted alone, athough there may also have been a conspiracy.

Это здорово. Но, спросим у Гугла или Яндекса.

Что мы имеем -- свободу выбора и возможность получить массу интересной информации. Оба эти поисковика ежедневно/еженедельно вносят изменения в алгоритмы поиска, что безусловно положительно влияет на качество.

Ваша технология несомненно хороша, но в составе полноценной поисковой системы. Или в составе выдачи одной из них :)

straylon:
Нужно написать настольную поисковую систему, которая позволяет проводить интеллектуальный поиск по ресурсам жесткого диска пользователя, ресурсам локальной сети, а также по сайтам в Интернет, которые укажет пользователь.

Краулинг и парсинг гипертекста можно осуществлять на Python или Perl, для всего остального где важна скорость -- С/С++. Хотя если десктоп аппликейшн, то только С++ (или D). Если конкурировать с Гугл или Яндекс (действительно, а какого черта :) ) то разрабатывать свои технологии (распределенного) хранения индекса. Ну а если же это все так -- "щоб було", тогда действительно подойдет и PostgreSQL, Яху например его активно использует. BerkeleyDB оч шустрая.

А какие алгоритмы уже проработаны? Ведь многое зависит как раз от того как именно хранятся данные. Тут все к простому SQL не сведешь.

Почитайте тут: http://ilpubs.stanford.edu:8090/361/ и тут http://owngarbage.narod.ru/Doc/Turtle_search_engine.doc

Вот еще была темка: Реально ли написать поисковик на php

И все же, наверное говорю как любитель. Создание поисковой системы -- задчача одна из сложнейших, но вместе с тем одна из самых интереснейших. Самому было бы интересно авторитетное мнение.

Если подходить с практической точки зрения, то есть Google пользовательский поиск и Google Desktop, Yandex.Server и Yandex.Desktop.

Однако может быть и своя специфика или абсолютно новая идея поиска. Она есть?

leonid.ws:
10 центов за гигабайт трафика. Напрямую к магистральным провайдерам можно подключиться в центрах обмена трафиком. В Москве и Питере.

http://www.msk-ix.ru/
http://www.ripn.net:8080/ix/

Большое спасибо.