aca74

Рейтинг
39
Регистрация
13.04.2006

Бывает письма не доходят. Пишите в личку email. Отправлю пароль!

Обновил парсер.

Исправлены глюки с ненужными символами, а также поправлен международный парсинг. (определение домена)


Скачивать тут

SeoNizator, вы правы - этого я не учёл. Зафиксю.

SeoNizator, спасибо. По гуглю пишите пожалуйста в следующий раз в ветку /ru/forum/521124

В ближайшее время обязательно пофиксю. Спасибо.

VMR:
Подписался получил пароль, скачал архив - в архиве папка assets в папке пусто.

Странно, скачал проверил в папке все лежит. Пароль правильно ввели? Папку assets с папкой result не путаете?

Напишите в личку ваш email, отправлю архив.

SeoNizator:

При автоматических запросах (и даже ручных) капча может появляться уже на второй странице (за Яшу не знаю - я говорю о Гугле). Поэтому настраиваемая задержка, а лучше интервал необходим. А так же необходимы прокси. Желательно юзер-агент и пр хедеры.

Урл вставлять не гуд. Нужно запрос, но при с возможность выбора др. параметров запроса.
Отсюда пожелания (ко всем парсерам): сделать шаблоны запросов. При вставке запроса просто выбирать нужный шаблон.

Пожелание 2. Со временем страницы выдачи имеют свойство меняться. Посему нужен понятный юзеру шаблонизатор результатов (те настраиваемый юзером сам парсер страниц выдачи)

Кстати, тогда не надо будет кучу парсеров, будет только один, но универсальный ;)

Пожелания приняты, спасибо :)

regnet:
Пароль на архив можно получить, подписавшись на нашу рассылку: - это как бы не очень хорошо.

Я даю вам парсер бесплатно, вы же мне свой email.

Бонус вам: пароль от всех будущих архивов. Подписываться уже не надо :)

Я считаю равноценный обмен.

n.anastasia:
aca74, почему только первые 9 стр?
лучше добавьте возможность ставить время задержки и самому указывать количество страниц.

Первые 9 парсятся без капчи как правило. Быстро, четко и просто.

Если парсить например 50 страниц, надо прикручивать автоввод капчи сервисом распознования, либо прокси - что уменьшает скорость парсинга в разы.

Но как пожелание по функционалу, принято и возможно будет реализовано.

MMikan, скорее нет, чем да. Возможность такая есть, но шаблонизатор не очень гибкий.

Появились примеры живущие более 2 месяцев в индексе.

Предложение актуально.

seomunch, и всем остальным в личку отправил.

Всем кто еще не видел примеров, пишите пожалуйста запросы на примеры, сразу в личку а не в топик.

В топике только вопросы, не связанные с примерами, пожалуйста.

Заранее благодарен.

Всего: 50