Небольшая ПС

TF-Studio
На сайте с 17.08.2010
Offline
334
357

Есть ли какие-то решения, позволяющие организовать небольшую Поисковую систему в ограниченном количестве сайтов. (штук 20-200)

То есть

1. индексация

2. разбор документов

3. ранжирование по запросам

4. формула релевантности, на основе коэффициентов, которые считаются отдельными ботами (ссылочное, плотность,...)

опционально исправление ошибок

сам поиск (+база исправления ошибок, опечаток) - вероятно на сфинксе, а движок на php хотелось бы

вносим сайты, бот скачивает, другой разбирает тексты, обновляет индекс, ищем.

https://habrahabr.ru/company/sphinx/blog/61807/

https://habrahabr.ru/post/147745/

интересный решений есть уже множество. пот отдельности.

а есть что-то цельное?

Всё ещё лучший способ заработка для белых сайтов: GoGetLinks (https://www.gogetlinks.net/?inv=fahbn8).
S3
На сайте с 29.03.2012
Offline
367
#1

elasticsearch

TF-Studio
На сайте с 17.08.2010
Offline
334
#2

Sly32 - почитайте внимательно вопрос.

ДП
На сайте с 23.11.2009
Offline
203
#3

Раньше был яндекс.сервер - там, насколько, я помню, можно было указать из каких сайтов составлять базу. Но вот по 4 пункту - там по-моему ничего не было. Ну или я просто не интересовался.

CP
На сайте с 12.08.2009
Offline
101
#4

Целого не встречал, но как ничего криминального в реализации нет, elasticsearch это и есть поисковая система, если сайты которые будут участвовать в поиске, ваши, то в принципе можно всё реализовать без особой крови. Единственная загвоздка будет в подготовке всех данных и отправке в elastic.

Профессиональный frontend: JS, html,css, Single-Page App (/ru/forum/964386)
TF-Studio
На сайте с 17.08.2010
Offline
334
#5

Сайты сторонние.

Определенной, единой тематики.

Поиск информации именно.

Свои - было бы все гораздо проще

CP
На сайте с 12.08.2009
Offline
101
#6
TF-Studio:
Сайты сторонние.
Определенной, единой тематики.
Поиск информации именно.

Свои - было бы все гораздо проще

Тогда сканирование текстов, занесение в базу, потом поиск по ней с ранжирование. Если ссылки, коэффициенты - то это всё, команда спецов, ферма серверов и серьезный бюджет.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий