Как реализовать алгоритм на PHP

12
KO
На сайте с 22.12.2003
Offline
0
2592

Прошу прошения , у меня есть вопрос.

Я пытаюсь написать поисковую систему , чтоб она находила на сайте битые ссылки.

Я столкнулся с такой проблемой , как алгоритмизировать получение УРЛов

Получается я должен через eregi_replace вытянуть все урлы.

А вот с REGEXP’ом у меня проблемы …

Может кто-то помочь и показать пример и описать малую часть.

Я понял что вытягивать нужно из

1)<A HREF

2) Содержащие HTTP

3)Содержащие WWW

Заранее благодарен , KLEVO

A
На сайте с 21.12.2003
Offline
15
#1

стукнись в аську, расскажу 133731

euhenio
На сайте с 21.09.2001
Offline
357
#2

preg_match("/<a[^>]+href=\s*['"]?([^'"\(\)\;]+)['"]?[^>]*>/i",$text,$linksarray)

-потом массив надо преобразовать - относительные урлы в абсолютные.

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
KO
На сайте с 22.12.2003
Offline
0
#3

За это спасиба.

Значит систему релевантности слов сделал.

Систему распознавания урлов тож ...

И такой вопрос.

Какие можете порекомендовать PHP поисковые скрипт (конечно фри) но с возможностью индексить сайты до 10.000 страниц.

+ Поиск с релевантностью , но лучше если быстрых.

Заранее благодарен , KLEVO

Григорий Селезнев
На сайте с 25.09.2001
Offline
298
#4

любишь ты PHP ...

KO
На сайте с 22.12.2003
Offline
0
#5

Ну а что посоветуеш :?

Просто за PHP 1)То что я его понимаю )))

2)То что он есть на всех номаных серваках

3)Что он не медленый.

_________________

А вот вопросик , знает кто сколько трафика кушает мета в месяц ...

Именно индексация+Запросы , не метасайт , а Мета Юкрейн

C
На сайте с 19.09.2001
Offline
120
#6
3)Что он не медленый

IMHO, очень спорное утверждение, особенно для RegExp.

С уважением, Владимир Чернышов. (не)?путевые заметки (http://chernyshov.kiev.ua/)
[Удален]
#7

Да и не только для RegEx, например с mysql без специальных телодвижений скрипт на php работает медленнее тех же скриптов на перле например в 6 раз. Но что штука удобная - спору нет, да и в серьезных задачах важен не софт, а версия hands.dll как известно. ;)

vmegap
На сайте с 03.02.2002
Offline
158
#8
Как писал Interitus
например с mysql без специальных телодвижений скрипт на php работает медленнее тех же скриптов на перле например в 6 раз.

Алексей, а что это за специальные телодвижения для php под MySQL?

Поделись!

С уважением,

Виктор

[Удален]
#9

А я не знаю, но есть легенда, что как-то можно производительность оптимизировать, чтобы все шуршало. Но по-моему проще критичные моменты переписать на perl/C. :)

vmegap
На сайте с 03.02.2002
Offline
158
#10
Как писал Interitus
но есть легенда, что как-то можно производительность оптимизировать, чтобы все шуршало.

Ну так этому целые тома книг посвящены. Не знаю, правда, что в них пишут :) - все только собираюсь приложиться к этой кладези мудрости, отпить, так сказать, из живительного источника.

Но что правильно выстроенная структура баз данных способна в несколько раз увеличить скорость обработки запросов - факт. Что в SQL, что в MySQL.

Кстати, из той же серии и рекомендации для увеличения скорости шуршания держать базы на многих хардах малой емкости (1-2 Гига).

С уважением,

Виктор

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий