Bazist

Рейтинг
43
Регистрация
15.01.2014

продолжаем тему )

jpg comics_dikaprio_orig_1346255182.jpg
tolika:
Ну и что?..

пишу слово газ

выдается куча внутренних ссылок http://booben.com/?q=%D0%B3%D0%B0%D0%B7&s=librus.ec
которые возвращают на страницу поиска...

Это я врядли починю. С помощью поиска можно только отискать книги

в которых встречается фраза, но авторских прав на предоставление сервиса по скачиванию самой книги у меня нет. 😕

tolika:

причем, слово маГАЗин мне не надо...

Починил. Там был небольшой баг в механизме нахождения сниппета текста.

JonnyB:

Исправлено ☝

+ подключена база Librus.Ec (280 ГБ текста/~450 тысяч книг)

Для геймеров, добавился в индекс еще один сайт gamedev.ru

Пример поиска, например, по слову Тетрис:

http://booben.com/?q=%D1%82%D0%B5%D1%82%D1%80%D0%B8%D1%81&s=gamedev.ru

блин, бот маджестик задосил 🙅.

сервис пока не доступный, скорей всего поднимится уже вечером

Gooroo-vs:
Блин, вот смотрю на тех, кто сие чудо комментирует и чувствую себя дураком... не могу понять смысла во всем этом, что с сайтом делать то нужно и для чего он?

Считается, что ассоциативный поиск имеет более качественную выдачу ориентированую на ожидания человека.

По сути, моделируется что-то вроде огромной нейросети. Каждое слово это нейрон. Документы говорят о связях между нейронами. Когда Вы отправляете запрос, вносите элемент раздражения в сеть, сеть пытается отискать ассоциативные цепочки с Вашим запросом и происходит конкуренция между документами внутри сети. Разные документы утверждают разные факты. Чем больше документов утверждает одно и тоже, тем истенней считается факт в рамках сети. На основе истинных фактов отбираются авторитетные документы которые и попадают в топ. Таким образом, не смотря на низкое качество контента, отсеиваются второстепенные документы внутри сети.

Сама по себе идея, конечно, еще сыра. Но постоянно дорабатывается.🍿

---------- Добавлено 02.09.2014 в 12:22 ----------

JonnyB:

Хм, странный баг. Может быть както связан с локализацией, попробую покрутить.

Багов хватает, но потенциал у движка есть.

pelvis:
А там как раз на первом месте была именно бизнес-модель ))

Нет. Там в первую очередь думали как сделать полезный сервис, а уже потом думали как монетизировать. Еслибы думали изначально о монетизации, получился бы второсортный ресурс, аля амазон с банерами.

pelvis:
А зачем? В чем бизнес-модель? :) Именно это меня и интересует. Тематический поиск по форумам? Если не брать в учет несколько значимых, остальное - д.же помоечное с точки зрения ценности :)

Ну я бы не сказал что прямо помоечное. Особенно если учитывать такие ресурсы как хабр.

На самом деле это огромная база знаний в которой отображено очень многие факты из реального мира. Даже удивительно как из огромной помойки текста, можно провести качественную кластеризацию текста. Выделить ассоциативные цепочки. А ведь умение ассоциировать и класифицировать это первый признак интеллекта. Так что копать есть что. На счет бизнесс модели есть такое понятие "делать гугл"(с).

Всего: 144