Need помощь...

SR
На сайте с 21.08.2004
Offline
1
584

Здравствуйте.

Начну я свой расказ.

1)Меня интересует нормальный поисковый движок на PHP.

Да , я знаю что его производительность очень низка , и прочие прелести. Меня интересует или статейки по написанию , или готовые варианты ботов (crawler).

И второстепенное , оболочка.

2)Как , получив содерживое страницы отрезать всё ненужное ?

Ну к примеру :

function strip_jsh($cache){

$search = Array ("'<script[^>]*?>.*?</script>'si","'<style[^>]*?>.*?</style>'si","/<\/?(.|\s)*?>/");
$output = preg_replace($search, " ", $cache);
return $output;
};
Отрезает стили и прочие , а как распознать УРЛ в толпе и убрать HTML,HEAd и т.д. ?

Заранее благодарен , Евгений.

А зачем Вам знать больше ? Яндекс, найдётся всё :)
SR
На сайте с 21.08.2004
Offline
1
#1

Знает кто-то по этой теме что-то ? :)))

[Удален]
#2

1) Существует немало готовых движков, в том числе бесплатных - http://www.hotscripts.com/PHP/Scripts_and_Programs/Search_Engines/index.html

2) Для парсинга html нельзя пользоваться регулярными выражениями. Лучше взять какую-нибудь готовую библиотеку (для перла это HTML::Parser, насчет php - не знаю, наверняка есть аналоги).

SR
На сайте с 21.08.2004
Offline
1
#3

Спасибо , но вот все бесплатные нормально работают )))

А кто-то знает бесплатный скрипт , за который и можно было б сделать donate ??

Lor
На сайте с 28.05.2004
Offline
352
Lor
#4
Для парсинга html нельзя пользоваться регулярными выражениями.

А можно поподробнее на эту тему?

Йопез - форум без модераторов. https://yopez.com
[Удален]
#5

В общем... так получилось, что я ни одного вопроса не понял. 😕

SR
На сайте с 21.08.2004
Offline
1
#6

Мой вопрос , какой продукт тебе больше всего понравился ?

А вопрос Lor'а , поповоду строчки "2) Для парсинга html нельзя пользоваться регулярными выражениями. Лучше взять какую-нибудь готовую библиотеку (для перла это HTML::Parser, насчет php - не знаю, наверняка есть аналоги)."

А можно поподробнее на эту тему? (Чаво ельзя ?)

Snake
На сайте с 18.06.2004
Offline
148
#7
Как писал
Для парсинга html нельзя пользоваться регулярными выражениями. Лучше взять какую-нибудь готовую библиотеку (для перла это HTML::Parser, насчет php - не знаю, наверняка есть аналоги).

Мож я чаво не понял а strip_tags чем не устраивает?

SR
На сайте с 21.08.2004
Offline
1
#8
Как писал Snake


Мож я чаво не понял а strip_tags чем не устраивает?

strip_tags отружет весь , и не оставит TEXT <meta describe="TEXT">.

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий