Про автоматическую внутреннюю перелинковку

EugeneVC
На сайте с 01.09.2008
Offline
128
1003

Начитался бормалея решил попробовать сайты свои полинковать. Дано сайт одной тематики - скажем про коньки.

1. Делаю на сайте блок похожие статьи - и пихаю туда статейки - это просто делается.

2. Беру из worstats и похожих мест запросы, выбираю по одной из ПС самые релевантные станицы и начинаю на них ссылаться с других странниц.

Запросы условно можно поделить на количество слов в запросе. Однословники, двухсловники, N словники. N редко превышает 5.

С однословными запросами все просто: конек, коньки, коньком - тут морфология работает и все ищеться.

Двухсловники: тут всего 2 перестановки и вроде тоже можно как с однословниками

А вот когда уже N>=3 - становиться тяжело.

Вопрос видели ли вы где нить алгоритмы как такие запросы искать:

что бы типа на запрос "заточка коньков москва" нашлось "москва точим коньки"

или посложнее

"точим коньки в москве"

SJ
На сайте с 16.03.2008
Offline
78
#1

Интересная тема :)

Я балуюсь со стеммером (чтобы не мучаться с морфологией и "нормальной формой") и хитрой регекспой, которая позволяет пропускать несколько слов (например, для "точим коньки" воплне подойдет "точим любые коньки").

Однако как с перестановкой слов оптимально решить - еще не придумал.

Можно конечно искать куски текста (максимальной\минимальной длинны), в которые входят все(или более х%) заданных "слов" из линки... Только вот с производительностью не очень, имхо :)

Любимый хостинг (http://beget.ru?id=2902) How can we grow old when the soundtrack of our lives is rock-n-roll?
[Удален]
#2

EugeneVC, а вот это "выбираю по одной из ПС самые релевантные станицы " если не секрет какой прогой делаете? а то када 10000 страниц как то ручками не удобно

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий