Скрипт поиска по сайту

[Удален]
1366

Никто не посоветует?

Желательно на PHP, необходимо чтоб индексировал динамически создаваемые страницы.

smscat
На сайте с 23.02.2006
Offline
50
#1
winguild:
Никто не посоветует?
Желательно на PHP, необходимо чтоб индексировал динамически создаваемые страницы.

странный подход.. а в чём проблема написать скрипт, который будет искать непосредственно по той же базе, что используется для генерации динамических страниц?

VC
На сайте с 03.04.2006
Offline
63
#2

Скрипт ищущий по динамическим страницам, должен учитывать структуру данных конкретного сайта. Т.е. ничего универсального тут не посоветуешь.

[Удален]
#3
smscat:
странный подход.. а в чём проблема написать скрипт, который будет искать непосредственно по той же базе, что используется для генерации динамических страниц?

Это не совсем обдуманный подход:

1. Искать по всем существующим таблицам в том виде, что они есть (без специально построенного индекса) с помощью LIKE, мягко говоря, нерационально. При некотором большом объеме БД поиск станет тормозить.

2. Непонятно, что делать с путями, нам же надо список страниц вывести. К примеру, если таблицу новостей я могу сопоставить со адресом news.php?id=... для каждой конкретной новости, то как быть с архивом новостей? Ведь искомое слово может быть в заголовке какй-нибудь новости в архиве да еще на 5-й странице. Т.е. придется скрипту поиска и страницы считать и урлы генерить и проверять их на существование, генерить названия страниц... Действий больше, чем при генерации динамических сраниц.

3. Если на сайте помимо динамики и статика есть, для нее отдельный скрипт поиска писать?

4. С краткими описаниями тоже не все понятно, как их давать. Особенно если данные из разных таблиц на странице.

Так что видим одни проблемы при таком подходе.

vasa_c:
Скрипт ищущий по динамическим страницам, должен учитывать структуру данных конкретного сайта. Т.е. ничего универсального тут не посоветуешь.

Да структура здесь не при чем. Забираем главную страницу, естественно хтмльку отдаваемую веб-сервером. Отпарсиваем все ссылки где путь относительный или с таким же HOST_NAME. Индексируем страницу, заносим в БД, идем по отпарсенным ссылкам, повторяем действия и т.д. При любой структуре сайта. Мы просто ходим по ссылкам внутри сайта.

В итоге и индекс специально построенный для быстрого поиска есть. И страницы в индексе именно такие, как видит их посетитель, и урлы реальные и т.д.

Я бы сам написал, да лень, думаю вот может готовые скрипты есть. Наверняка есть.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий