Поскольку скриптик ещё по таймауту жаловался, выкладываю рабочий вариант полностью
<?
set_time_limit(0);
$cat = 'Business/Production/';
$delay = '7';
$url = 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat;
$np_pat = '/<a target="_self" href="(.*)"><font color="#333333">след.<\/font><\/a>/U';
$yc_pat = '/<li>\n<font><a.*href="(.*)".*>.*<\/li>/isU';
echo "<ol>";
while ($data = file_get_contents($url)) {
$data = iconv('utf-8', 'cp1251', $data);
preg_match_all($yc_pat, $data, $o1, PREG_SET_ORDER);
foreach ($o1 as $o) echo "<li>".$o[1]; flush();
preg_match($np_pat, $data, $o2);
$url = ($o2 ? 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat. $o2[1]:FALSE);
sleep($delay);
}
?>
Не только, ещё и логике не поддаётся.
Вчера: ксапов на счету - 65 000,
Снёс 3 проекта общей стоимостью в примерно 10 000 ксапов в месяц.
Сегодня: на счету 60 000 ксапов, при том что прогноз на 1 день ксапов: 1086 (нужное число для продления действующих ссылок)
Полное несоответсвие. Мало того что списали за сутки в 5 раз больше своего-же собственного прогноза, так и за 3 удалённых проекта ничего не вернули.
Для тех кто думает что удалённые не успели проплатиться - на днях было снято со счёта прим 70 000 ксапов
Мде... такого про Я. не читал ещё...
Не переживайте сильно, это очередной глюк скорей всего.
Напишите Платонам, они пояснят.
Вот в ксапе например удалять ненужные по ИД страницы, как у Вашего скриптика с этим?
Чёт не втыкает новый дизайн, может с непривычки?
Ну а кто мешает проверять на уникальность статью? В сеозавре не реген, не знаю тамошних порядков, но кто мешает сразу после публикации(если ДО неё нет возможности) чекнуть на уникальность и оставить/убрать?
Тут дело не в сеозавре, как таковом, или любой другой подобной системе, а в банальной лени и/или неграмотности ВМ.
Да, на нескольких площадках, на которых купил.
Ваш вариант не сработал, но идею понял, прописал
всё заработало. ТНХ!
Осилил весь топик, всё что хотел сказать тут уже сказано.
Начал удалять нафиг проекты, поражаюсь на себя, как можно было настолько верить системе и юзать её практически с открытия. Всё верно - решала бросовая цена, в том смысле, что я мало интересовался стоят ли мои ссылки, проиндексированы ли они.
А решающим в удалении пректов стала излишне усложнённая процедура удаления ссылок с непонравившихся страниц и невозможность занести урл в ГБЛ для вообще всех проектов. Без этого проверки и удаления не имеют смысла, всё равно заново на этом удалённом Г. разместит система.
Во время парсинга при переходе на 2-ю страницу:
Warning: file_get_contents(/yca/tungrp/cat/Employment/Freelance/1.html) [function.file-get-contents]: failed to open stream: No such file or directory in D:\aaa\home\localhost\1\index.php on line 8
где 8-я строка:
В пхп я ноль, так что мне это не решить :)