Тогда проблем нет, но нужно будет периодически врубать переиндексатор файловой части сайта при изменении содержания. А по базе поиск - раз плюнуть.
Чтобы скрипт "гулял" по сайту на 100% нужна гарантия 100%-ной перекрестности ссылок, т.е. все ссылки должны находиться автоматически. И потом, если часть в базе, часть в файлах, то придется делать двойной поиск типа там preg_match() + SELECT, или делать все равно полный индекс в базе или в SQL-файле, потому как медленно будет работать при большом объеме информации.
Не хватает данных для того, чтобы понять: что нужно. Откуда будет браться инфа (MySQL или просто страницы)? Что значит индексация по ссылкам сайта? А если ссылки не полностью перекрестные и часть страниц отвалится? Если будет индексация по страницам, то сколько размер сайта (индекс занимает прилично)? Пример нашего поиска можно глянуть на http://uraltrucks.urr.ru
BackLinkBot Links Exchange - есть встроенный поиск фраз по всем поисковикам. Например, на запрос "каталог ссылок" находит до 1500 ссылок с процентом совпадения по теме (т.е. действительно каталогов ссылок а не что-либо еще) порядка 75%. Базовая версия $20.
А как такое может быть, что морда выпала и на Яндекс и на Апорт и на Рамблер (забугорные поисковики все в порядке)? Кто-нибудь с таким сталкивался?
Запустили полную версию. Из особенностей продаж - можем конфигурировать скрипт под клиента, есть несколько вариантов скриптов. Требования PHP, Curl, sockets, MySQL, Zend
Вдогонку несколько слов о требованиях. Программа работает и на локали и на сервере. Демо устойчиво трудится только на локали. Это связано с особенностями сессий. Для полной версии локаль не рекомендуется ибо траффик кушается прилично - 1 страница - 30-160 кб., а их в проверке может быть до 10000. Требования к софту - PHP 4+, Curl, sockets, Zend optimizer, MySQL или без нее.
Яндекс, Рамблер и другие русские поисковики довольно долго держат в базе уже дохлые ссылки. Быстрее всего от них избавляется Гугль. А вообще, можно постоянно мониторить ссылки с помощью проги http://backlinkbot.urr.ru. Это гораздо оптимальнее ручного мониторинга и по времени и по затратам траффика.
А в каком месте вылезла эта штука? Перетряхнул весь индексный файл - все работает. Но это только линкообменник. Демка на странице "Заказать".