Поиск в базе

lagif
На сайте с 15.12.2004
Offline
30
#11

Vyacheslav Tikhonov, Что имеется в виду? Индекс, или оперативка под него? Или объем вспомогательной БД? Или контент?

Это тоже пройдет...
A
На сайте с 26.01.2005
Offline
58
#12

Может я не правильно выразился. данные лежат в Mysql. есть поле description и title И по ним бы хотелось бы иметь приемлимый поиск, а не просто LIKE из базы :) насколько я понял поисковики которые есть индексируют html страницы, а с базу на прямую не идексят. Надеюсь сейчас вопрос понятен?

lagif
На сайте с 15.12.2004
Offline
30
#13

akor,

Мне кажется, что вы не с того начинаете... документ не только по тайтлу характеризуется, а еще по многим параметрам... или вы делаете поиск локальный?

VT
На сайте с 27.01.2001
Offline
130
#14
Что имеется в виду?

Общий объем html (количество сайтов и страниц) и поискового индекса.

A
На сайте с 26.01.2005
Offline
58
#15
lagif:
akor,
Мне кажется, что вы не с того начинаете... документ не только по тайтлу характеризуется, а еще по многим параметрам... или вы делаете поиск локальный?

да. я хочу получить нормальный поиск из локальной базы.

VT
На сайте с 27.01.2001
Offline
130
#16
есть поле description и title И по ним бы хотелось бы иметь приемлимый поиск, а не просто LIKE из базы

Самый простой способ, который здесь неоднократно обсуждался - создать индекс в отдельной таблице вида

id_слова - id_записи_в_базе .

Дальше с ними работать совсем просто - делаете выборку по слову, получаете список документов и ранжируете документы по плотности ключевых слов.

Z
На сайте с 03.01.2004
Offline
32
#17
akor:
Может я не правильно выразился. данные лежат в Mysql. есть поле description и title И по ним бы хотелось бы иметь приемлимый поиск, а не просто LIKE из базы :) насколько я понял поисковики которые есть индексируют html страницы, а с базу на прямую не идексят. Надеюсь сейчас вопрос понятен?

У mnogosearch и dataparksearch есть виртуальная схема htdb для индксирования содержимого базы.

[Удален]
#18

akor, объем какой?

Есть встроенные в mysql средства fulltext, как раз для английского языка, но они для приемлимой производительности требуют, чтобы индекс помещался в ОП.

pelvis
На сайте с 01.09.2005
Offline
345
#19
lagif:
Мне кажется, что вы не с того начинаете... документ не только по тайтлу характеризуется, а еще по многим параметрам... или вы делаете поиск локальный?

Title весомей чем контент, естессно, но и контент не нужно сбрасывать со счетов. Как совет для небольшого поисковичка по локалке слить слова из тайтла в контент и проставить вес слов с учетом коэф-та заголовка (какой - решать Вам)

Продаю вывески. Задарма и задорого (https://www.ledsvetzavod.ru/)
lagif
На сайте с 15.12.2004
Offline
30
#20

Vyacheslav Tikhonov, Индекс... скажем так, больше гига... сайтов - сейчас под 60 тыс. (это еще не весь уанет), страниц... примерно раз в 20 больше (когда все утсаканится и индекс будет более полным - можно будет сказать точней). Естественно, контент занимает больше, чем индекс. :)

Сейчас критически не хватает оперативки...

akor, локально - имелся в виду поиск по локальному сайту, а не по Сети или ее сегменту... для таких целей mysql подойдет вряд ли.

pelvis, все верно, но хранить в БД только это - недальновидно, имхо...

Наблюдение: по запросам на первом месте одна порнуха... :(

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий