Подскажите парсер сайтов

12
cscope
На сайте с 13.02.2005
Offline
525
1972

Раньше помню попадались сайты, контент которых я так понимаю был спарсен из разных источников и все это было красиво уложено в шаблон, что с виду было похоже не на дор, а что то между ГС и СДЛ ). И все это было на автомате сделано.

L
На сайте с 30.10.2015
Offline
34
#1
...
R
На сайте с 20.02.2015
Offline
59
#2

"Яндекс Rich Content API" не плохо парсит контент страницы, но увы закрывают 15-го числа. Из платных видел такой http://www.diffbot.com/products/automatic/analyze/ можно нагуглить "readability algorithm" готовые классы на PHP.

GAMMA
На сайте с 27.12.2006
Offline
154
#3

Минималистический блоговый движок Nano CMS отлично умеет грабить контент из RSS лент. Правда он давно не развивается, но работает без проблем

Мой сервис блогов (http://mublog.ru) и личный блог (http://blogroot.ru)
PN
На сайте с 22.08.2012
Offline
103
#4
cscope:
Раньше помню попадались сайты, контент которых я так понимаю был спарсен из разных источников и все это было красиво уложено в шаблон, что с виду было похоже не на дор, а что то между ГС и СДЛ ). И все это было на автомате сделано.

Поскольку найти готовое решение, позволяющее и спарсить, и запихнуть в шаблон, вряд ли получится, и все равно придется допиливать, проще сразу написать с нуля - тем более это вопрос нескольких часов:)

Мой совет помог? Не скупись! Bitcoin 1Lseddet1o1B6odgXQHbGaWGwRkt1Db8Ef Ethereum 0x450f1a17461e25194B7F9226cDEe70173F39e1e1
totamon
На сайте с 12.05.2007
Offline
437
#5
proksey-net:
Поскольку найти готовое решение, позволяющее и спарсить, и запихнуть в шаблон, вряд ли получится

правда что ли? конечно с нуля интереснее писать чем 10 минут погуглить.... или пояндексить😂

Домены и хостинг https://8fn.ru/regru | Дедик от 3000р https://8fn.ru/73 | VPS в Москве https://8fn.ru/72 | Лучшие ВПС, ТП огонь, все страны! https://8fn.ru/inferno | ХОСТИНГ №1 РОССИИ https://8fn.ru/beget
cscope
На сайте с 13.02.2005
Offline
525
#6

Народ, читайте внимательнее - интересует не парсер (просто парсер не проблема найти, у самого есть x-parser), а пакетная версия, где контент сразу упаковывается в шаблон, причем все это выглядит весьма достойно, пару лет назад выкладывали на серче урлы таких сайтов сделанных в автоматическом режиме, причем с нормальной посещалкой и в РСЯ.

Наверняка такой софт если и есть, то он явно не паблик и даже не 100$ стоит.

donc
На сайте с 16.01.2007
Offline
663
#7

Связка из KD и textKit разве что приходит на ум.

Парсер парсит кучу страниц по запросам, более менее, красиво выдает html простыню, а текст кит из нее делает сайт.

Осуждаем применение нейросетей в SEO и не только ( https://webimho.ru/forum/148/ ) :) Продвижение сайтов от 25 000 в мес, прозрачно, надежно ( /ru/forum/818412 ), но не быстро, отзывы ( http://webimho.ru/topic/3225/ )
S
На сайте с 29.01.2006
Offline
404
#8

Зеброид есть, но не знаю насколько качественно работает.

Есть плагины под WordPress (и для других движков, наверняка, тоже), которые берут RSS с сайтов и постят на ваш сайт, но тут надо пробовать, смотреть какой вам подойдет.

http://wprobot.net/ru.php - 129 долларов.

R
На сайте с 20.02.2015
Offline
59
#9
Scaryer:
Зеброид есть, но не знаю насколько качественно работает.
Есть плагины под WordPress (и для других движков, наверняка, тоже), которые берут RSS с сайтов и постят на ваш сайт, но тут надо пробовать, смотреть какой вам подойдет.
http://wprobot.net/ru.php - 129 долларов.

Как я понял ТС-у не нужны RSS ленты а надо выдачу парсить по ключу и циклично проходит ТОП дергая 5-10 статей с сайтов, далее все это красиво оформить + видосов напарсить с ютуба и все это уложить в БД какойнить движка..

ТС, видел такие сайты.. Если даже на этом форуме и есть владелцы такого скрипта, то врятли они вам скажут.. Выход, только писать на заказ.

totamon
На сайте с 12.05.2007
Offline
437
#10

под WP есть и готовые решения, тот же wpgraber, сайт умер но в паблике можно найти скрипт, телгери завалена готовыми автонаполняемыми сайтами по 100р))

Content Egg плагин, есть бесплатная версия /ru/forum/903739

под дле rss-граббер не знаю живой нет, но грабил он не только rss...

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий