UPD Парсер тематического контента {free} Pt2

AESCBC192
На сайте с 11.06.2016
Offline
51
#51
Dos3:
напиши чем ты уже пробовал парсить

в личку ему пиши. мне твое фуфло неинтересно.

Dos3
На сайте с 07.01.2011
Offline
363
#52
AESCBC192:

н а схерали ты сюда приперся его софт впаривать

так тыж сам спросил - есть ли нормальный платный софт, а не говно как в первом посте, я и ответил

AESCBC192
На сайте с 11.06.2016
Offline
51
#53

Dos3, слыш ты щень, за словами следи, дерьмо на первой паге одно - это ты непрошенное.

Dos3
На сайте с 07.01.2011
Offline
363
#54
AESCBC192:
в личку ему пиши. мне твое фуфло неинтересно.

а мне похрен на твои интересы :)

AESCBC192
На сайте с 11.06.2016
Offline
51
#55
Dos3:
так тыж сам спросил - есть ли нормальный платный софт

а где именно я задл такой вопрос в данном топике?

ядаже знаю ответ. - нигде.

slavok
На сайте с 28.10.2008
Offline
167
#56
очевидно всеже таки ради тролинга.

а что есть в платных парсерах чего нет в этом? только конструктив. я даже спрашивал прямо - что добавить?

Да нет, действительно интересно было.

Ну в теме уже ведь писали, парсит только с 1 поисковика. Нет прокси. Встречаются дубли контента, когда один и тот же текст парсится несколько раз.

Это явные недостатки, о которых я узнал, даже не скачивая Ваш парсер.

А если потестить и сраванить с тем же X-parser'ом, то думаю недостатков будет больше в разы.

ПФ. Дорого. Эффективно. В ЛС
AESCBC192
На сайте с 11.06.2016
Offline
51
#57
Dos3:
а мне похрен на твои интерес

ну и с**л отсюда

[Удален]
#58
AESCBC192:
да ты чё. предлагаешь брутить запрсами урл?

---------- Добавлено 25.02.2017 в 19:21 ----------


н а схерали ты сюда приперся его софт впаривать

могу сказать, как я делаю. несколько серваков с кравлерами. общая база урлов. бегают по сайтам, ищут rss фиды, скачивают фиды (из них чистый текст проще получать, так как это валидный xml). потом создается индекс скачанных текстов. по индексу я ищу подходящие для морфинга тексты. язык определяется по тексту. узкое место это поиск по индексу, так как для поисковых запросов все-таки приходится парсить Google/Bing autocomplete. ты про word2vect писал. думаю, что можно использовать для получения кейвордов из самого текста. далее задача классификации тематики текста. я где это видел. по-моему, Stanford NLP это делает

AESCBC192
На сайте с 11.06.2016
Offline
51
#59

slavok, ну не тести. что я тебе еще сакажу, если допилить самому не судьба - можешь денег отлистать за хэпарсер... или ап подождть.

Dos3
На сайте с 07.01.2011
Offline
363
#60
AESCBC192:
Dos3, слыш ты щень, за словами следи, дерьмо на первой паге одно - это ты непрошенное.

да не нервничай ты так, а то клаву ещё сломаешь, и скучно в разделе станет 🙅

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий