Чем парсить контент?

12
N0
На сайте с 11.09.2010
Offline
126
#11
SenSS #:

X-Parser не может нормально парсить выдачу яндекса)))

С помощью хпарсер лет 5-6 парсил рамблер (у которого выдача яндекса). Поскольку парсишь статьи, то ниче страшного, что какой-то урл будет немного не на той позиции как в оригинальной выдаче яндекса.

Последний раз парсил в мае или июне 2020, там вроде новая капча появилась, но думаю проблем быть не должно.

x-parser + capmonster = парсил без прокси и без расходов. Иногда бывало 200-300 капч за сутки, а иногда 20 тыс. Потому что:

парсил в 12-14 окон хпарсера, в каждом по 50 потоков. Выдача тоже 50 результатов. Итого 600-700 потоков (конечно нужен соответствующий проц и соединение напрямую, без роутера). По несколько статей на ключ. 10 гб статей в сутки.

Кроме этого, есть платные сервисы для парсинга xml яндекса и гугл. Они есть в хпарсер. Недавно так гугл парсил, всё ок.

SaleSeo
На сайте с 26.07.2007
Offline
352
#12

X-parser + Xevil топовый набор, может многое, Яндекс капчта 100% разгадывание, не нужно платить сервисам

Если что-то парсить прямо сложное, datacol можно подключать в работу

Во как раз связка работает на серваке:


Прогон BULLET для крауд,PNB,зеркал,доров https://bootmasterru.com/postingbyxrumer.html | Честное SEO,настройка Я Директ,семантика и оптимизация под ключ https://saleseo.ru :)
neonlabs
На сайте с 21.07.2011
Offline
105
#13
Если тексты и смысл, то можно настроить запросы через bard.google
Выполняю заявки GoGetLinks, Miralinks, Rotapost за 30 рублей под ключ
JL
На сайте с 04.05.2018
Offline
52
#14
Дорвеи живы? 
L
На сайте с 25.12.2013
Offline
314
#15
john_le #:
Дорвеи живы? 

Живы только сейчас их так с ходу и не отличишь от нормальных сайтов, сделанных для людей. А суть-то та же. Дорвеи - это сайты, сгенерированные для получения траффика из поисковых систем. При этом сайты сейчас генеруются на лету, ссылки проставляются автоматом и так далее.

Недорогой, надежный и отзывчивый VPS хостинг ( https://bit.ly/3eXUnNN ) Проверенная пуш партнерка с ежедневными выплатами ( https://vk.cc/9wLSrL)
Антоний Казанский
На сайте с 12.04.2007
Offline
615
#16
Бумеранг777 :
Возник вопрос парсинга сайтов.
Бумеранг777 :
Не позиции товаров а именно содержимое страниц. Как это сделать?

Ассортимент выбора настолько широк (от браузерных приложений до самостоятельных программ типа A-parser и Zennoposter), что отталкиваться надо от задачи.

Если просто спарсить отдельные поля, то хватить программы SC Frog и 15-минутного прослушивания ролика про использования Xpath.

Если с данными нужно выполнять какую-то логику (сравнения, калькуляции, работа с БД), то мой выбор - Zennoposter. Фактически это уже не просто программа, а полноценная среда для программирования необходимой автоматизации (не так давно об этом писал).


Бумеранг777 #:
думаю проще будет заказать парсинг.

Зависит от задачи.

В общем и в среднем в парсинге конечно надо разбираться. 

√ SEO продвижение https://akazansky.ru - поиск новых точек роста, экспертный аудит сайтов ( https://akazansky.ru/audit-sajtov ), внедрение эффективных решений цифрового маркетинга. © Обстоятельно, ответственно, доступно.
JL
На сайте с 04.05.2018
Offline
52
#17
Lastwarrior #:

Живы только сейчас их так с ходу и не отличишь от нормальных сайтов, сделанных для людей. А суть-то та же. Дорвеи - это сайты, сгенерированные для получения траффика из поисковых систем. При этом сайты сейчас генеруются на лету, ссылки проставляются автоматом и так далее.

у меня лет 5 назад было около 150 статей,  после попытки загрузить их разом домен влетел под какой-то фильтр яндекса, как подозрительный

12

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий