Полностью самописная , и там и там .
Вот здесь ты попутал .
Во-первых, говори по-русски, бесит .
Во-вторых, Каким образом ты можешь удалить ВСЮ рекламу с сайта ( я не говорю про сапу , бегун , директ и тд , а про , скажем , баннеры ) , или у тебя тут все предусмотрено , нереальный алгоритм ? А если я делаю редирект ? И тут у тебя идет перехват заголовка Location? А если аякс ? :)
Всему ужасно верю .
Те регулярки что ты привел - это ты называешь подменой текста ? ;) Насмешил .
В общем nocomments .
В общем смысл этого скрипта - делать выдачу того сайта , который зеркалишь .
И относиться это будет только к сайтам ( можно сказать говносайтам ) , у которых нет особой динакими ( форм например ) . Или даже если они будут , но не будут пахать , также как и баннеры все вырезать нельзя .
Под хорошие сайты нужно делать индивидуально , например я недавно за пару дней рипанул один из крупнейших ремонтных порталов , с абсолютно теми же возможностями ( общение на форуме , корзина => онлайн заказ , и тд) . Сделал это только ради интереса ;)
http://www.google.ru/search?hl=ru&q=pagerank+script&btnG=%D0%9F%D0%BE%D0%B8%D1%81%D0%BA+%D0%B2+Google&lr=&aq=f
?
А зачем спрашивать ?
Бред , не имеющий никакого смысла , добавляющий геморроя и снижающий производительность .
Обычный чел , сидящий на gentoo с iceweasel .
А то что он обратился к 1762 страницам , это уже Вам стоит предполагать - почему ;)
Тут все на одно лицо ..
За 10$ продаю самописный аналог в серверном виде , собранные ключевики толкает в .csv )
Писал челу за 30$ недавно .
icq 291-250-323 .
P.s. если конечно кого-то интересует .
Sla_Dom, я уже своё написал )
Терь вопрос - а каким образом можно посмотреть в яндекс xml, какие страницы на сайте проиндексированы ? А то мне обычный запрос выводит не больше трех страниц ))