Найти: title="(.*)" alt=""
Заменить на: title="\1" alt="\1"
Вообще почитайте про рег. выражения здесь: http://pyha.ru/forum/topic/19.0
Найти: (\d\d\d) \d\d\d
Заменить на: \1 тыс.
В links.txt должны урлы лежать в столбик и начинаться с http://
<?php
$links=file_get_contents("links.txt");
$link=explode($links, "\n");
for($i=0;$i<count($link); $i++)
{
echo $link[$i].": ";
$page=file_get_contents($link[$i]);
preg_match_all("/([0-9a-zA-Z]([-.w]*[0-9a-zA-Z])*@([0-9a-zA-Z][-w]*[0-9a-zA-Z].)+[a-zA-Z]{2,9})/si", $page, $regs);
echo $regs[1][0]."<br>";
}
?>
Как-то так?
А какие минусы у парсера?
Ведь парсер контента с основного сайта и xml - в принципе мало чем отличаются.
Только если разрешением на использование..:)
Наверное сами составляют:)
XML наврятли.
Информеры есть.
http://sport-informer.ru/f-informer.html
Это серч подменил.
У меня тоже самое.
Возможно. Надо пробовать.
Попробуйте добавить <param NAME=wmode VALUE=transparent>
Да ну нет там таких куков.
Вот этот скрипт работает:
<?php $refer ="http://ya.ru/"; $url ="http://yandex.ru/yandsearch?text=CAD&lr=35"; $user_cookie_file = $_SERVER['DOCUMENT_ROOT'].'/cookies.txt'; $ch = curl_init($url); curl_setopt($ch, CURLOPT_URL,$url); curl_setopt($ch, CURLOPT_RETURNTRANSFER,1); curl_setopt($ch, CURLOPT_USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)"); curl_setopt($ch, CURLOPT_COOKIEFILE, $user_cookie_file); curl_setopt($ch, CURLOPT_COOKIEJAR, $user_cookie_file); $html = curl_exec($ch); curl_close($ch); echo $html; ?>
И проблема на 99% в ip.
Да, вот такое решение отлично. Сразу не додумал. Если честно, ни в одном открытом движке это не видел по умолчанию.
Сменили просто в пма у юзера и всё?