Parsim.ru - нужна помощь по javascript - для всеобщего блага и всеобщего парсинга :)

12
euhenio
На сайте с 21.09.2001
Offline
357
1639

http://parsim.ru/

Это будут javascript-букмарклеты на панель ссылок, которые позволяют автоматически скачивать всякие разные вещи без установки программ и выдавать удобные отчёты.

Это возможно за счет того, что скрипт запускается от имени основного окна (букмарклетом, ссылкой на панели ссылок), и тогда такой скрипт сможет иметь доступ к данным с этого домена, сможет открывать разные окна с этого домена по заданию, сможет даже делать последовательный просмотр. Суммировать данные и выдавать табличку под Эксель.

Понятно, что вся выкачка идет из-под вашего логина, с куками и прочим. Поэтому капчи должно быть мало, но для совсем уж массового парсинга это не подходит, - так обычно такие количества и не нужны. Вот нужно пробить, например, сто запросов - и что, для этого какие-то программы ставить или даже покупать? ненене...

Это работает примерно так:

Перетаскиваете себе ссылку букмарклета на панель ссылок

Нажимаете ее - если вы находитесь не на целевом домене, оно предложит туда перейти

Находясь на целевом домене, с которого будете качать - нажимаете еще раз, оно предложит ввести нужные параметры парсинга

Стартуете выкачку. При этом могут запускаться новые окна, их не надо закрывать и в них не надо ничего менять

Когда закончит, оно сообщит.

Про будущее сервисов. Сейчас пробивка частот, потом - контроль позиций по запросам. Вообще, есть множество сервисов, которые хочется парсить из-под логина. И не только поиск - и соцсети, например.

А совсем хорошо было бы завести что-то вроде общего репозитория разных скачивалок.

Сейчас есть тестировочная версия для пробивки частот по wordstat.yandex.ru - но нужна помощь зала, там иногда возникают какие-то ошибки при ожидании загрузки. Сам-то я js плохо знаю, поэтому сейчас загрузка делается так - запускается новое окно и раз в секунду проверяется, прогрузилось ли оно, есть ли доступ к его тексту. Если нет, ждется еще. И какая-то непонятная ошибка иногда возникает. А хорошо было бы просто какое-то событие повесить на полную загрузку текста.

Нужна помощь javascript-знатоков!

Респекты, уважуха гарантированы! :)

Писать приглашаю в емейл etrofimenko@yandex.ru или в тему или в личку

Советы принимаются в любом виде.

В принципе, можно и заказать платно, но тут дополнительно еще разных советов могут накидать по логике работы парсилки :)

с ув., Евгений Трофименко seo блог Trofimenko.ru ( http://trofimenko.ru/ ) но ыыы мало обновляется... Tools.Promosite.ru - анализатор апдейтов Яндекса (пожертвуйте лимиты на Яндекс.XML! ( https://searchengines.guru/ru/forum/801888/page7#comment_11942489 )) Konvr.ru - увеличение конверсии сайта на 81% за 4 недели ( http://konvr.ru/ )
euhenio
На сайте с 21.09.2001
Offline
357
#1

пичалька никто не хочет (

Thommy
На сайте с 06.05.2010
Offline
139
#2

Не бросайте затею. Жаль,не силен в js, а то поучаствовал бы непременно.

bukachuk
На сайте с 07.09.2008
Offline
97
#3

Идея прикольная. Вчера на ночь глядя ковырялся так и не понял где ошибка зарыта, времени маловато:( Ошибка еще возникает не всегда это вообще проблема

Программирование PHP,Mysql (/ru/forum/934470)
euhenio
На сайте с 21.09.2001
Offline
357
#4

Спасибо bukachuk, благодаря ему, кажется, все решилось, работает без ошибок.

респекты и уважухи )

плз проверьте у кого как

теперь вопрос - кому что нужно парсить? :)

forest25
На сайте с 12.09.2009
Offline
67
#5
euhenio:
Спасибо bukachuk, благодаря ему, кажется, все решилось, работает без ошибок.
респекты и уважухи )
плз проверьте у кого как

теперь вопрос - кому что нужно парсить? :)

С вк хотелось бы спарсить прямые линки на фотоальбом группы.

VPS 512MB 20GB SSD KVM - 5$ (http://u.hmdw.me/digitalocean) | ИМХО о хостингах (http://u.hmdw.me/hosting)
euhenio
На сайте с 21.09.2001
Offline
357
#6

вк, конечно, попозже будет отложено...

прямые ссылки на фотографии из альбома?

forest25
На сайте с 12.09.2009
Offline
67
#7
euhenio:
вк, конечно, попозже будет отложено...
прямые ссылки на фотографии из альбома?

Да, то есть к примеру натравливаем парсер на url альбома, а скрипт выдергивает прямые ссылки на оригиналы. Там уже можно будет их wget'у скормить.

Дмитрий Севальнев
На сайте с 26.06.2009
Offline
97
#8
euhenio:
http://parsim.ru/
Это будут javascript-букмарклеты на панель ссылок, которые позволяют автоматически скачивать всякие разные вещи без установки программ и выдавать удобные отчёты.
***
В принципе, можно и заказать платно, но тут дополнительно еще разных советов могут накидать по логике работы парсилки :)

Евгений, мне кажется народ просто не разобрался, как обычно, как вообще это работает=)

Поэтому нет фидбека.

Вроде начало парсить, но косяков вылезло. Ну видимо поэтому и просишь помощи=)

В целом вещь забавная, так не далеко и кликовые ПФ начать крутить.

Считай сидишь и сам себе ПФ подкручиваешь.

Вопросы:

  • Не ясно, нужно ли сейчас парсить wordstat, если есть почти халявный кейколлектор?
  • Кроме соц.сетей и там где нужна поддержка js, что ещё парсить то нужно?

Чем могу поспособствовать:

  • Могу написать нормальный мануал как этим вообще пользоваться.
  • Могу подкинуть пару вещей которые надо парсить под логином для репозитория, если дело пойдёт.
Модуль ведения SEO-проектов https://tools.pixelplus.ru/projects/ — уникальные возможности оптимизации. Канал с обучением SEO на YouTube: https://youtube.com/pixeltools, Чат с поддержкой: http://t.me/pixelwebinars
S2
На сайте с 07.01.2008
Offline
611
#9

А какие требования к закладке? Во первых, это только мозилла? Во вторых, флешплеер какой версии нужен? В 10-м, на странице вордастата, нажимаю на закладку - сразу выпадает ошибка:

Error: Error #2134: Невозможно создать SharedObject.
at flash.net::SharedObject$/getLocal()
at FlashCookie()

и браузер наглухо блокируется на время.

Не надо приписывать мне свои выводы, я имею ввиду только то, что написал. Лучшая партнёрка по футболкам/толстовкам (http://partnerka.kolorado.ru/?ref=1921540) Опрос: Проверить текст на уник - как? (/ru/forum/495885)
jcrush
На сайте с 04.07.2004
Offline
371
#10

Oops! Google Chrome could not find parsim.ru

ЧЯДНТ?

» Блог (http://blog.stfw.ru/) - SEO-заметки. ДВчат: @dvchat (https://t.me/dvchat)
12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий