Новый поисковый концепт

B
На сайте с 15.01.2014
Offline
43
19896

Сейчас пытаюсь усовершенствовать поисковые алгоритмы концептуально отличающиеся от того, что предлагают гиганты вроде google или yandex.

Основной концепт заключается в том, что примитивная поисковая строка не соответствует тому обьему информации, который обрабатывает поисковая система. Обьем информации в интернете растет экспоненциально и разрыв между поисковой строкой и сотнями миллионов страниц в интернете усугубляется еще больше. Это проблема.

Как ответ этой проблеме предложено разработать простой и мощный язык поисковых запросов, так называемый язык запросов по неструктурированым данным.

Внук фасетного поиска :idea:.

Например запрос может выглядеть так:

Я ищу страницы где
есть много разных слов из категории "Позитивные отзывы", список слов будет выведен в отдельную колонку 'Позитивные отзывы'
а также
есть слово или фраза "google"

Энжин который сможет обрабатывать такие запросы я уже начал собирать.

Экспериментальный конструктор запросов есть на этой странице:

http://booben.com/Query

Каждый запрос состоит из нескольких частей.

Части бывают пяти типов.

1. Указываем точное вхождение фразы или слова (логика И)

2. Указываем вручную список слов (логика ИЛИ)

3. Указываем категорию слов, из нее чтото должно быть найдено.

4. Указываем категорию слов, из нее должно быть найдено максимальное количество слов

5. Указываем диапазон значений.

Что еще важно, поисковая машина не просто выдает топ страниц, она отображает данные в табличном виде. В такой системе легко построить запрос "Найти все страницы где есть картинки или видео" и поисковая машина отдаст таблицу в которой будут только картинки или видео.

www.booben.com (www.booben.com) - ассоциативный поисковый движок Блог (blog.pikosec.com) - как создавался поисковый движок с нуля Альбом (http://booben.com/Query?q2=CustomPhrase%2Bssearch%20%40today%20%40img%2B1&s=online&a=search&p=1) картинок searchengines.guru за сегодня
B
На сайте с 15.01.2014
Offline
43
#1

Имплементировал смарт паука. Наконец сервис стал не офлайновый, а онлайновый.

База обновляется автоматом с лагом гдето в 4 часа, пока что по одному сайту в тестовом режиме.

+ В самых дорогих ресторанах не только приносят еду, но и показывают как ее готовят :)

Добавил простейшую страницу мониторинга спайдера и базы данных поисковика

http://booben.com/Monitoring

Посмотрим как база будет рости. По ощущениям даже если сайтов будет штук 50,

одного инмемори инстанца хватит на лет 5.

🍿

B
На сайте с 15.01.2014
Offline
43
#2

Добавил статью в блог, Роботы поисковой системы: http://blog.pikosec.com/?p=138

B
На сайте с 15.01.2014
Offline
43
#3

Таки да, сделал небольшую документацию по формированию стримов и языку запросов поисковой машины http://blog.pikosec.com/?p=141

🍿

D.iK.iJ
На сайте с 26.05.2013
Offline
239
#4
Адаптивный дизайн в 2 строчки ( https://dikij.com/wm/adaptaciya-saytov.php ). + Принимаю заказы любой сложности ( https://searchengines.guru/ru/forum/926323 ). 💎 Еще я делаю классные кулоны с опалами ( https://mosaicopal.ru/ ).
L
На сайте с 07.12.2007
Offline
351
#5
Bazist:
Как ответ этой проблеме предложено разработать простой и мощный язык поисковых запросов, так называемый язык запросов по неструктурированым данным.

Чем elasticsearch не устроил?

B
На сайте с 15.01.2014
Offline
43
#6
Ladycharm:
Чем elasticsearch не устроил?

Тем что я могу написать лучше.

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#7

Кодировка ломается у выдачи:

http://booben.com/Query?q2=CustomPhrase%2Bсекс%2B1&s=online&a=search

---------- Добавлено 21.06.2015 в 11:54 ----------

И ссылкой тоже делиться нельзя, из урла считывается криво в поле для ввода.

✅ Мой Телеграм канал по SEO, оптимизации сайтов и серверов: https://t.me/leonidukgLIVE ✅ Качественное и рабочее размещение SEO статей СНГ и Бурж: https://getmanylinks.ru/ ✅ Настройка и оптимизация серверов https://getmanyspeed.ru/
B
На сайте с 15.01.2014
Offline
43
#8
LEOnidUKG:
Кодировка ломается у выдачи:
http://booben.com/Query?q2=CustomPhrase%2Bсекс%2B1&s=online&a=search

---------- Добавлено 21.06.2015 в 11:54 ----------

И ссылкой тоже делиться нельзя, из урла считывается криво в поле для ввода.

Кодировку починил, а вот с ссылкой.

Нужно какието символы заменить ?

LEOnidUKG
На сайте с 25.11.2006
Offline
1774
#9
Bazist:
Кодировку починил, а вот с ссылкой.
Нужно какието символы заменить ?

В IE вот так выглядит: http://i11.pixs.ru/storage/7/2/4/xxxxxxxxxx_3885731_17754724.png

Это если взять и скопировать урл и вставить.

B
На сайте с 15.01.2014
Offline
43
#10
LEOnidUKG:
В IE вот так выглядит: http://i11.pixs.ru/storage/7/2/4/xxxxxxxxxx_3885731_17754724.png

Это если взять и скопировать урл и вставить.

К сожалению IE не поддерживается, все тестируется на Хроме :(

По крайней мере пока не будет толкового фронтендщика.

Добавил в тренды онлайн базу, теперь можно отслеживать популярность разных терминов

в разрезе времени сразу по всем имеющимся ресурсам.

http://booben.com/Stat?q=%D1%83%D0%BA%D1%80%D0%B0%D0%B8%D0%BD%D0%B0%20%D1%80%D0%BE%D1%81%D1%81%D0%B8%D1%8F%20%D1%81%D1%88%D0%B0%20%D0%B5%D0%B2%D1%80%D0%BE%D0%BF%D0%B0&s=online

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий