Отечественный поисковый движок

B
На сайте с 15.01.2014
Offline
43
#31
LDblue:
Демо есть?

Сорри ребята, не сразу увидел куда перенесли тему.

Сейчас на текущей работе запара (в связи с ее сменой),

я планирую вернутся через месяц к озвученым идеям.

На счет альфы, она была и крутилась, пока у меня был другой провайдер у которого купил выделенный айпи. Текущий провайдер к сожалению такой услуги не предостовляет, потому негде развернуть сайт.

www.booben.com (www.booben.com) - ассоциативный поисковый движок Блог (blog.pikosec.com) - как создавался поисковый движок с нуля Альбом (http://booben.com/Query?q2=CustomPhrase%2Bssearch%20%40today%20%40img%2B1&s=online&a=search&p=1) картинок searchengines.guru за сегодня
Froolex
На сайте с 08.06.2011
Offline
56
#32
Bazist:
Сорри ребята, не сразу увидел куда перенесли тему.
Сейчас на текущей работе запара (в связи с ее сменой),
я планирую вернутся через месяц к озвученым идеям.

На счет альфы, она была и крутилась, пока у меня был другой провайдер у которого купил выделенный айпи. Текущий провайдер к сожалению такой услуги не предостовляет, потому негде развернуть сайт.

Я могу дать вам место на сервере и даже помочь с дизайном и юзабилити:-)

Настоящий облачный хостинг (https://goo.gl/kuxXMK) от 1$ в месяц!
Magician
На сайте с 08.07.2010
Offline
43
#33

Тоже готов помочь с дизайном, иконками.

B
На сайте с 15.01.2014
Offline
43
#34

Доброго всем времени суток.

Пока что к полномаштабной реализации поисковика не приступил.

Но реализовал небольшой сервис по обмену сообщениями.

http://net.pikosec.com

По сути он построен на поисковом движке. Каждое сообщение имеет привязку к тегам. С помощью тегов, можно формировать ленту сообщений.

Подробней здесь есть.

http://net.pikosec.com/map

Diversant
На сайте с 29.03.2006
Offline
329
#35

Круто, удачи в вашем деле!

Froolex
На сайте с 08.06.2011
Offline
56
#36
Bazist:
Доброго всем времени суток.
Пока что к полномаштабной реализации поисковика не приступил.
Но реализовал небольшой сервис по обмену сообщениями.
http://net.pikosec.com

По сути он построен на поисковом движке. Каждое сообщение имеет привязку к тегам. С помощью тегов, можно формировать ленту сообщений.
Подробней здесь есть.

http://net.pikosec.com/map

ТС сайт недоступен, предложения по предоставлению вам места на сервере ещё актуально;)

trahtor
На сайте с 06.12.2005
Offline
426
#37

Мда, жаль, хотел-бы посмотреть.

M
На сайте с 27.01.2013
Offline
68
#38
Froolex:
ТС сайт недоступен, предложения по предоставлению вам места на сервере ещё актуально;)

Все еще не могу достучаться....

Новый сервер или адрес так и не появился?

Очень жаль!

B
На сайте с 15.01.2014
Offline
43
#39

Добрый День,

Сайт к сожалению не доступен, поскольку срок аренды тестового сервера истек, новой площадки пока еще не подобрал.

Теперь к поисковику. На выходных вернулся к работе над поисковым движком, точнее самой важной его частью, частью ранжирования документов. Удалось реализовать достаточно интересный алгоритм на основе асоциативных связей. Суть его в том, что каждый документ пытается утверждать разные факты о разных сущностях. Так вот наибольший рейтинг получает тот документ, который больше всего говорит о значимых фактах с других страниц. Звучит немного запутано, но проще всего рассмотреть это на каком-то простом примере.

Например есть первая страница, которая утверждает что машины ездят.

Есть вторая страница, которая утверждает, что машины продают.

Так вот побеждает та страница, которая утверждает что машины И ездят И их продают. Она получает максимальный рейтинг, поскольку больше всего содержит фактов о сущности "машины".

Если сравнивать выдачу с другими поисковыми системами, например, Гугл, то получается у поисковика выдача более социально ориентирована. Нельзя сказать что эта выдача лучше или хуже чем у гугла, по сути она просто другая. Гугл старается сделать более "энциклопедическую выдачу". Например, по запросу "золото" пытается вернуть информацию о драгоценном метале и его химическом составе. У меня выдача, более социально ориентирована. Понятие золото, достаточно атрофировано в социальных сетях и подвязано чаще всего к золотовалютным резервам стран, поэтому движок делает релевантными страницы которые хорошо рассказывают о золотовалютных резервах других стран.

Если сделать запросы по технологиям, то хороший рейтинг получают страницы которые "перемывают косточки" технологиям. Например по запросу "винда" поисковик выдает первыми страницами, где говорят о зависаниях, перезагрузках, синих экранах, вирусах и прочьих особенностях технологии. Тогда как Гугл просто пытается рассказать что такое Виндовз в энциклопедической манере.

Froolex
На сайте с 08.06.2011
Offline
56
#40

Bazist, Почему то мне кажется что алгоритм сильно недоработанный, получается можно будет напарсить кучу кеев со статистики и добавить их на страницу то сайт будет иметь максимальный рейтинг. Нужно делать более глубокий анализ самого контента и на основании его делать рейтинг. Просто тот же гугловский ПР получается эффективнее вашего алгоритма. Попробуйте посмотреть в сторону гео привязки, тематики, социальных факторов (лайки, репосты). Так же рекомендую сделать вам внутренний каталог сайтов, чтобы вы могли присваивать регион, тематику, соц. страницы ресурса, язык, описание и т.п...

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий