Парсер выдачи yandex.ru - На выходе XML, CSV, TXT. Приятный интерфейс. Бесплатно.

12
A7
На сайте с 13.04.2006
Offline
39
1855

Здравствуйте.

Хочу представить вашему вниманию, парсер выдачи яндекса.

Скрин интерфейса

Из плюсов:

  • Удобный понятный интерфейс
  • Использование AJAX, позволяет работать с парсером, не обновляя постоянно страничку
  • Для парсинга нужен лишь адрес (URL) выдачи.
  • Парсер собирает: Название URL, сниппет, URL
  • Целых 3 формата на выходе: CSV; XML; TXT
  • И всё это абсолютно бесплатно!

Из минусов:

  • Парсит 9 первых страниц выдачи

Скачивать тут

p.s.
Это не пиар сайта, это пиар рассылки :smoke:

regnet
На сайте с 12.11.2009
Offline
164
#1

Пароль на архив можно получить, подписавшись на нашу рассылку: - это как бы не очень хорошо.

[Удален]
#2

aca74, почему только первые 9 стр?

лучше добавьте возможность ставить время задержки и самому указывать количество страниц.

A7
На сайте с 13.04.2006
Offline
39
#3
regnet:
Пароль на архив можно получить, подписавшись на нашу рассылку: - это как бы не очень хорошо.

Я даю вам парсер бесплатно, вы же мне свой email.

Бонус вам: пароль от всех будущих архивов. Подписываться уже не надо :)

Я считаю равноценный обмен.

n.anastasia:
aca74, почему только первые 9 стр?
лучше добавьте возможность ставить время задержки и самому указывать количество страниц.

Первые 9 парсятся без капчи как правило. Быстро, четко и просто.

Если парсить например 50 страниц, надо прикручивать автоввод капчи сервисом распознования, либо прокси - что уменьшает скорость парсинга в разы.

Но как пожелание по функционалу, принято и возможно будет реализовано.

[Удален]
#4
aca74:
вы же мне свой email.

А зачем он тебе? ;)

aca74:
Первые 9 парсятся без капчи как правило

При автоматических запросах (и даже ручных) капча может появляться уже на второй странице (за Яшу не знаю - я говорю о Гугле). Поэтому настраиваемая задержка, а лучше интервал необходим. А так же необходимы прокси. Желательно юзер-агент и пр хедеры.

Урл вставлять не гуд. Нужно запрос, но при с возможность выбора др. параметров запроса.

Отсюда пожелания (ко всем парсерам): сделать шаблоны запросов. При вставке запроса просто выбирать нужный шаблон.

Пожелание 2. Со временем страницы выдачи имеют свойство меняться. Посему нужен понятный юзеру шаблонизатор результатов (те настраиваемый юзером сам парсер страниц выдачи)

Кстати, тогда не надо будет кучу парсеров, будет только один, но универсальный ;)

A7
На сайте с 13.04.2006
Offline
39
#5
SeoNizator:

При автоматических запросах (и даже ручных) капча может появляться уже на второй странице (за Яшу не знаю - я говорю о Гугле). Поэтому настраиваемая задержка, а лучше интервал необходим. А так же необходимы прокси. Желательно юзер-агент и пр хедеры.

Урл вставлять не гуд. Нужно запрос, но при с возможность выбора др. параметров запроса.
Отсюда пожелания (ко всем парсерам): сделать шаблоны запросов. При вставке запроса просто выбирать нужный шаблон.

Пожелание 2. Со временем страницы выдачи имеют свойство меняться. Посему нужен понятный юзеру шаблонизатор результатов (те настраиваемый юзером сам парсер страниц выдачи)

Кстати, тогда не надо будет кучу парсеров, будет только один, но универсальный ;)

Пожелания приняты, спасибо :)

VMR
На сайте с 10.01.2010
Offline
119
VMR
#6

Подписался получил пароль, скачал архив - в архиве папка assets в папке пусто.

Руки прямые? - Лей траф в ApiShops (http://vk.cc/1VkeTN), если хочешь чтобы лендинги делали за тебя тогда лей на BigGon (http://vk.cc/1ZSefq) (Рефам всяческая помощь) У обоих целевой конверт 1:15-40! (Без Шейва!) Мой ID-ApiShops-Биржи: 52125 (http://www.apishops.com/Webmaster/WebsiteGroup/UserOrderStat.jsp?userId=52125)
A7
На сайте с 13.04.2006
Offline
39
#7
VMR:
Подписался получил пароль, скачал архив - в архиве папка assets в папке пусто.

Странно, скачал проверил в папке все лежит. Пароль правильно ввели? Папку assets с папкой result не путаете?

Напишите в личку ваш email, отправлю архив.

[Удален]
#8

Парсер гугли криво работает:

1. берёт в результаты "Новости по запросу".

2. Если в анкоре есть разделители (|, например) - он их корректно не обрабатывает - бъёт по ним. В результате чего в место урла продолжение анкора и тд.. (см даже по образцовому запросу ;) )

3. При экпорте в цсв не удаляет ; (из анкора и сниппета), что понятно приводит к кривизне файла.

4. Не обрабатывает (или криво) " и тд

A7
На сайте с 13.04.2006
Offline
39
#9

SeoNizator, спасибо. По гуглю пишите пожалуйста в следующий раз в ветку /ru/forum/521124

В ближайшее время обязательно пофиксю. Спасибо.

Unsiker
На сайте с 23.03.2009
Offline
43
#10

Попробывал парсер, вставил УРЛ, подождал 20 минут, так он и ничего не спарсил...

Мне трудно теперь сохранить реальность улыбки, Еще труднее быть с кем-то самим собой.
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий