продолжаем тему )
Это я врядли починю. С помощью поиска можно только отискать книги
в которых встречается фраза, но авторских прав на предоставление сервиса по скачиванию самой книги у меня нет. 😕
Починил. Там был небольшой баг в механизме нахождения сниппета текста.
Исправлено ☝
+ подключена база Librus.Ec (280 ГБ текста/~450 тысяч книг)
Для геймеров, добавился в индекс еще один сайт gamedev.ru
Пример поиска, например, по слову Тетрис:
http://booben.com/?q=%D1%82%D0%B5%D1%82%D1%80%D0%B8%D1%81&s=gamedev.ru
блин, бот маджестик задосил 🙅.
сервис пока не доступный, скорей всего поднимится уже вечером
Считается, что ассоциативный поиск имеет более качественную выдачу ориентированую на ожидания человека.
По сути, моделируется что-то вроде огромной нейросети. Каждое слово это нейрон. Документы говорят о связях между нейронами. Когда Вы отправляете запрос, вносите элемент раздражения в сеть, сеть пытается отискать ассоциативные цепочки с Вашим запросом и происходит конкуренция между документами внутри сети. Разные документы утверждают разные факты. Чем больше документов утверждает одно и тоже, тем истенней считается факт в рамках сети. На основе истинных фактов отбираются авторитетные документы которые и попадают в топ. Таким образом, не смотря на низкое качество контента, отсеиваются второстепенные документы внутри сети.
Сама по себе идея, конечно, еще сыра. Но постоянно дорабатывается.🍿---------- Добавлено 02.09.2014 в 12:22 ----------
Хм, странный баг. Может быть както связан с локализацией, попробую покрутить.
Багов хватает, но потенциал у движка есть.
Нет. Там в первую очередь думали как сделать полезный сервис, а уже потом думали как монетизировать. Еслибы думали изначально о монетизации, получился бы второсортный ресурс, аля амазон с банерами.
Ну я бы не сказал что прямо помоечное. Особенно если учитывать такие ресурсы как хабр.
На самом деле это огромная база знаний в которой отображено очень многие факты из реального мира. Даже удивительно как из огромной помойки текста, можно провести качественную кластеризацию текста. Выделить ассоциативные цепочки. А ведь умение ассоциировать и класифицировать это первый признак интеллекта. Так что копать есть что. На счет бизнесс модели есть такое понятие "делать гугл"(с).