awasome может fonts.googleapis.com ?
Вам дело сказали... Явно вы чего то не дополнили.. из под коробочки такого софта нет(а если есть то $$$$$ считайте как нули) и не буде в свободном доступе.
ссылку на источник дайте..
Скорее всего есть у данного сайта какая то база изображений..
jano, на php код:
$valid = array(); $lines = file("test.txt", FILE_IGNORE_NEW_LINES | FILE_SKIP_EMPTY_LINES); foreach ($lines as $n => $line) { if (strpos($line, "view.php?") !== false) $valid[] = $line; } file_put_contents("res.txt", implode("\n", $valid));
В res.txt результат оброботки
Этот пример нельзя считать готовым решением, написан на коленке за 15 минут. Если углубится в тему 10 строками кода не обойтись.
Многое не учтено, к примеру тег base и относительные пути когда присутствуют двоеточие "/../path/index.html".
Еще есть такие форматы ссылок: tel|callto:
The WishMaster, Как понял на поддомене. Было сайт.ру стало free.new.сайт.ру
От того и не понимает человек как сделать.
Берете DNS сервера можно бесплатные, к примеру у яндекса или у вашего регистратора. И редактируем A записи.
Будет доступен второго и третьего уровня домен.
Только я не понимаю... зачем переезжать на поддомен третьего уровня:)
Смотрите историю whois домена смотрите когда был снят с делегирования, смотрите по датам веб-архив что висело, смотрите историю индексации(благо сервисов валом). Сопоставить полученные данные и можно понять как индексировался сайт и когда он вылетел из индекса, после снятия с делегирования или до. Если до снятие с делегирования, что висело на домене.
Тем самым определим был фильтр на индекс, то есть бан.
А б/у домен на мой взгляд луче новорега.
Идити на аукционы освобождающихся, там с более кол-вом бэков можно найти домен под кино сайт.
По моему вес отдаваемой страницы увеличиться как минимум на один байт:)
Одной регуляркой не обойтись.
$host = "www.test.ru"; $links = array(); $content = preg_replace(array("#<!--[\s\S]+?-->#", "#<script[\s\S]+?</script>#i"), "", file_get_contents("http://www.test.ru")); if (preg_match_all("@<a\s([^>]*)?href\s*=\s*[\"']?([^#>'\"\s]*)[\"']?([^>]*)?>@i", $content, $matches)) { // убираем www if (strpos($host, "www.") === 0) $host = substr($host, 4); foreach ($matches[2] as $n => $href) { // атрибуты тега, если надо парсить $attr = $matches[1][$n]." ".$matches[3][$n]; if (empty($href)) continue; // не парсим протоколы if (preg_match("#^(mailto|skype|magnet|ftp):#i", $href)) continue; // абсолютная ссылки if (preg_match("#^(https?:)?//(www\.)?([^/]+)(/.*)?$#", $href, $match)) { if (strcmp($host, strtolower($match[3])) !== 0) continue; $href = $match[4]; } // если относительная не начинается с "/" if (strpos($href, "/") !== 0) $href = "/".$href; //$links[] = $href." | ".$matches[0][$n]; $links[] = "http://".$host.$href; } } print_r($links);
lockki, Шо пробовал?
Глянь выдачу по новостным запросам.
darkleech, это что новое.
Можно увидеть пациента?