UPD Парсер тематического контента {free} Pt2

AESCBC192
На сайте с 11.06.2016
Offline
51
#61

Nickolay365, стэнфорд нлп слишком навернута для таких задач, есть либы проще с тем же аутпутом. чем парсить фиды скачай двд на торренте с 10га текста, эффект тот же, а если рили - то фигня твоя система, лучше один раз грамотно бан обойти.

---------- Добавлено 25.02.2017 в 19:37 ----------

Dos3:
да не нервничай ты

а я спокоен, ты просто тупой и не калибруешь состояний.

---------- Добавлено 25.02.2017 в 19:42 ----------

Nickolay365, сколко Gb база у тебя и сколкьо M урлов пройдено? Ярд есть?

Dos3
На сайте с 07.01.2011
Offline
363
#62
AESCBC192:
а я спокоен, ты просто тупой и не калибруешь состояний.

если это твоё спокойное состояние, то тебе тем более нервничать нельзя, натворишь ещё делов ;)

AESCBC192
На сайте с 11.06.2016
Offline
51
#63

Dos3, ну да, осталось вот пробить твой айпишник и дом бабушки у котрой ты пирожки ходишь кушать))

Dos3
На сайте с 07.01.2011
Offline
363
#64
AESCBC192:
пс уже не помню какие но штук 10 наверно есть.

и память у тебя совсем хреновая, 1 пс запил и забыл, нервный наверно потому что

AESCBC192
На сайте с 11.06.2016
Offline
51
#65

Dos3, да ты нудный пещерный олень просто. пойди займись чемнить или к бабуле сгоняй)

[Удален]
#66
AESCBC192:
Nickolay365, стэнфорд нлп слишком навернута для таких задач, есть либы проще с тем же аутпутом. чем парсить фиды скачай двд на торренте с 10га текста, эффект тот же, а если рили - то фигня твоя система, лучше один раз грамотно бан обойти.

---------- Добавлено 25.02.2017 в 19:37 ----------


а я спокоен, ты просто тупой и не калибруешь состояний.

---------- Добавлено 25.02.2017 в 19:42 ----------

Nickolay365, сколко Gb база у тебя и сколкьо M урлов пройдено? Ярд есть?

не вижу ничего навернутого в Stanford NLP. какие еще?

для текстов я, конечно, могу скачать двд. только я не говорил, что это основная и единственная задача. одна из. другие скачиванием текста с торрентов или парсингом гугла не решаются

ярда нет. доменных имен первого уровня где-то 100 млн. эта база в формате binary json занимает примерно 17Gb

Dos3
На сайте с 07.01.2011
Offline
363
#67

AESCBC192, ты чисто по бабушкам ? :)

может от этого все твои проблемы ? даже парсер и тот говно получился :D

AESCBC192
На сайте с 11.06.2016
Offline
51
#68

Nickolay365, ну а че за основная задача?

---------- Добавлено 25.02.2017 в 19:58 ----------

Dos3, ну ты школота сдуя по всему и любишь пирожки вот предложил тебе сгонять по школотеме. чет неясно)

не мне тины больше по приколу))

[Удален]
#69
AESCBC192:
Nickolay365, ну а че за основная задача?

---------- Добавлено 25.02.2017 в 19:58 ----------

Dos3, ну ты школота сдуя по всему и любишь пирожки вот предложил тебе сгонять по школотеме. чет неясно)

не мне тины больше по приколу))

основная задача, как ты выяснил, троллить конкурентов по тарифу 5 коп/мин

Dos3
На сайте с 07.01.2011
Offline
363
#70

по теме топика, ТС прикрути прокси к парсеру, уже лучше станет, иначе действительно только для побаловаться, тем более если пс только гугл.

тем более что время теперь у тебя есть :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий