den78ru

den78ru
Рейтинг
395
Регистрация
12.04.2006

Поскольку скриптик ещё по таймауту жаловался, выкладываю рабочий вариант полностью

<?

set_time_limit(0);

$cat = 'Business/Production/';

$delay = '7';

$url = 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat;

$np_pat = '/<a target="_self" href="(.*)"><font color="#333333">след.<\/font><\/a>/U';

$yc_pat = '/<li>\n<font><a.*href="(.*)".*>.*<\/li>/isU';

echo "<ol>";

while ($data = file_get_contents($url)) {

$data = iconv('utf-8', 'cp1251', $data);

preg_match_all($yc_pat, $data, $o1, PREG_SET_ORDER);

foreach ($o1 as $o) echo "<li>".$o[1]; flush();

preg_match($np_pat, $data, $o2);

$url = ($o2 ? 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat. $o2[1]:FALSE);

sleep($delay);

}

?>

Don John:
тоже собираюсь большинство удалять. финансовая отчетность просто безобразна. черт ногу сломит. 😕

Не только, ещё и логике не поддаётся.

Вчера: ксапов на счету - 65 000,

Снёс 3 проекта общей стоимостью в примерно 10 000 ксапов в месяц.

Сегодня: на счету 60 000 ксапов, при том что прогноз на 1 день ксапов: 1086 (нужное число для продления действующих ссылок)

Полное несоответсвие. Мало того что списали за сутки в 5 раз больше своего-же собственного прогноза, так и за 3 удалённых проекта ничего не вернули.

Для тех кто думает что удалённые не успели проплатиться - на днях было снято со счёта прим 70 000 ксапов

Мде... такого про Я. не читал ещё...

Не переживайте сильно, это очередной глюк скорей всего.

Напишите Платонам, они пояснят.

Вот в ксапе например удалять ненужные по ИД страницы, как у Вашего скриптика с этим?

Чёт не втыкает новый дизайн, может с непривычки?

Ну а кто мешает проверять на уникальность статью? В сеозавре не реген, не знаю тамошних порядков, но кто мешает сразу после публикации(если ДО неё нет возможности) чекнуть на уникальность и оставить/убрать?

Тут дело не в сеозавре, как таковом, или любой другой подобной системе, а в банальной лени и/или неграмотности ВМ.

Zonk:
Вы проверяли что контекст не палится по "?" перед тем как написать?

Да, на нескольких площадках, на которых купил.

Ваш вариант не сработал, но идею понял, прописал

$url = ($o2 ? 'http://pda.yaca.yandex.ru/yca/tungrp/cat/'.$cat. $o2[1]:FALSE);

всё заработало. ТНХ!

Осилил весь топик, всё что хотел сказать тут уже сказано.

Начал удалять нафиг проекты, поражаюсь на себя, как можно было настолько верить системе и юзать её практически с открытия. Всё верно - решала бросовая цена, в том смысле, что я мало интересовался стоят ли мои ссылки, проиндексированы ли они.

А решающим в удалении пректов стала излишне усложнённая процедура удаления ссылок с непонравившихся страниц и невозможность занести урл в ГБЛ для вообще всех проектов. Без этого проверки и удаления не имеют смысла, всё равно заново на этом удалённом Г. разместит система.

Во время парсинга при переходе на 2-ю страницу:

Warning: file_get_contents(/yca/tungrp/cat/Employment/Freelance/1.html) [function.file-get-contents]: failed to open stream: No such file or directory in D:\aaa\home\localhost\1\index.php on line 8

где 8-я строка:

while ($data = file_get_contents($url)) {

В пхп я ноль, так что мне это не решить :)

Всего: 13058