- Поисковые системы
- Практика оптимизации
- Трафик для сайтов
- Монетизация сайтов
- Сайтостроение
- Социальный Маркетинг
- Общение профессионалов
- Биржа и продажа
- Финансовые объявления
- Работа на постоянной основе
- Сайты - покупка, продажа
- Соцсети: страницы, группы, приложения
- Сайты без доменов
- Трафик, тизерная и баннерная реклама
- Продажа, оценка, регистрация доменов
- Ссылки - обмен, покупка, продажа
- Программы и скрипты
- Размещение статей
- Инфопродукты
- Прочие цифровые товары
- Работа и услуги для вебмастера
- Оптимизация, продвижение и аудит
- Ведение рекламных кампаний
- Услуги в области SMM
- Программирование
- Администрирование серверов и сайтов
- Прокси, ВПН, анонимайзеры, IP
- Платное обучение, вебинары
- Регистрация в каталогах
- Копирайтинг, переводы
- Дизайн
- Usability: консультации и аудит
- Изготовление сайтов
- Наполнение сайтов
- Прочие услуги
- Не про работу

Зачем быть уникальным в мире, где все можно скопировать
Почему так важна уникальность текста и как она влияет на SEO
Ingate Organic
Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий
Kletskov,
http://php.net/manual/ru/reference.pcre.pattern.syntax.php
Прошу прощения
За что отвечает $delay = '3'; ? ( Програмёр я никакой )
И ещё один вопрос
Запустил скрипт Он спарсил 2000 урлов Хотя в разделе 6500.
яндекс только 100 страниц в пагинаторе показывает.
Андрей, подскажите новичку как составляются паттерны (шаблоны) для парсинга. Я изучал ваши паттерны, но в них так и не разобрался. Весь интернет перерыл, но так и не нашёл. Не могли бы Вы скинуть ссылочку или вкратце рассказать о правилах составления паттернов?
$np_pat = '/<a target="_self" href="(.*)"><font color="#333333">след.<\/font><\/a>/U';
$yc_pat = '/<li>\n<font><a.*href="(.*)".*>.*<\/li>/isU';
$pattern = '/<table border="0" width="100%" cellspacing="0" cellpadding="5">(.*?)<\/table>/is';
$pattern2 = '/<tr class="tlist".*?><td><a href=".*?">(.*?)<\/a><\/td>[\n]*<td align=["]*right["]*>([\d]+)<\/td><\/tr>/is';
Объясните на этих примерах суть.
Заранее благодарю
Посмотрите http://www.regexbuddy.com/
Я сам на нее наткнулся буквально вчера =) Там есть примеры всякие.
у меня скрипт из категории Спорт вытащил 2000 ссылок, а там 3800. С чем может быть связано?
одно из:
1) яндекс заблокировал ваш айпи
2) закончился тайм-лимит выполнения скрипта
Нет. по другим разделам продолжает.
А тайм-лимит как-то изменить можно? (сорри, далеко не программер).
PS скинул бы на благотворительность несколько вмз, если сделаете из скрипта так, чтоб он сразу по 50 ссылок разбивал. то есть тупо 2 br или еще что-то между каждыми 50...чтоб скопировать 50 и вставить в сапе...А то так заколебаться можно 2000 ссылок по 50 отсекать.
Спасибо.
А то так заколебаться можно 2000 ссылок по 50 отсекать.
Эт точно. :) Минут 20 уходит, чтобы всё загнать.
Можно, конечно, и студентов посадить.
Особенно если проектов больше 30-40.
Но мне кажется, что это не так сложно реализовать.
Эт точно. :) Минут 20 уходит, чтобы всё загнать.
stussy, основаня проблема как раз в сапе, когда она начинает переваривать 1000 ссылок... потом 1050.... потом 1100.
А если туда весь "Бизнес" загнать? Сколько там сайтов, пятизначное количество? Легче уговорить Авелона сделать загрузку избранного текстовым файлом.
Жень, ага? :)
Тогда готов и Жене несколько wmz отдать, Avelon, можешь снять несколько баксиков с моего профиля в сапе, если сделаете.:)
stussy, основаня проблема как раз в сапе, когда она начинает переваривать 1000 ссылок... потом 1050.... потом 1100.
А если туда весь "Бизнес" загнать? Сколько там сайтов, пятизначное количество? Легче уговорить Авелона сделать загрузку избранного текстовым файлом.
Жень, ага? :)