kolchakA

kolchakA
Рейтинг
228
Регистрация
19.06.2010

Имхо, все зависит от качества донора. В сапе тоже попадаются достойный внимания площадки)

Прокси и случайный выбор юзер агентов поддерживает поддерживает?

XENU для этого лучший вариант, хотя смотря что ТС имеет в виду под понятием битых ссылок

pehota:
Какова текущая стоимость парсера? Обновляется?

Текущую стоимость разных версий парсера можно найти на моем блоге. По поводу демки и скидок обращайтесь в личку или аську.

Asin:
Есть плагины, автоматом удаляющие дубли. Ищем на оф сайте вордпресс.

те что я нашел, удаляют уже существующие, а мне нужно чтобы если пост неуникален, то он даже НЕ добавлялся. Поэтому и нужен хук.

Hartamon:
<?

$arr=array("8093-232-1342 Андрей", "Антон 7128299", "Александр 3829999 0982299818");
foreach ($arr as $str)
{
preg_match("/([\d,\-]+)/", $str, $matches);
echo ($matches[1])."\n";
}
?>

Работает, но вот блин столкнулся с такими номерами типа: "8093 232 1342 Андрей"

Первое вырезает 8093

А еще бывают такие "8093 232 1342 700 28 98 Андрей"

'[umka:
;8315860']Так вот этот кусок не повторяется:
<p class="txt"><strong>.*?</strong>

Функция выводит всё, что полностью соответствует шаблону.

[umka] добавил 08.01.2011 в 15:02
Значит нужно действовать в два этапа.
Этап 1. Из всей страницы выдрать кусок со списком категорий.
Этап 2. С помощью preg_match_all выдрать повторяющиеся ссылки.

да уже так и сделал, просто думал как то все таки можно одной регуляркой)

Ladycharm:
Для preg_math_all не надо хвосты до и после, попробуйте: #<a.*?>(Категория\d+)</a>#ims

да в том то и проблема, что это я просто показал участок кода - а если я так буду со всей страницы резать - то у меня все анкоры сохранятся)))

'[umka:
;8315717']Вам поможет функция preg_match_all()
(если речь идёт о php)

ну так именно ее и юзаю. А она возвращает только одно вхождение (первое получается), например:

Категория1, хотя по идее должно все возвращать

Спасибо за отзыв! Кстати о появлении этого отзыва мне также помогла узнать LanceRing. Вот как я настроил программу для слежения за этой темой форума.

Всего: 425