UPD Парсер тематического контента {free} Pt2

T
На сайте с 15.11.2011
Offline
120
#71

пздц ТС нервный...

чё вы его еще больше накаляете?

ТС ты не слушаешь дельных советов.

1. Прикрути проксю.

2. Сделай чистку текста от дубликатов и всякого шлака типа мыл, телефонов, китайских иероглифов и арабской вязи.

3. Прикрути элементарный типограф (я уже писал об этом где-то, возьми хоть JSTypography-master).

4. Сделай возможность разбивки текста на абзацы с заголовками из первой строки абзаца (радиобатон, надо не надо).

5. Сделай возможность вставки тематичных картинок (радиобатон, надо не надо).

Хочется чтоб на выходе были готовые к публикации тексты. ОЧЕНЬ МНОГО ТЕКСТОВ. ПРОСТО ДОХЕРИЩА ТЕКСТОВ!

Чтоб в день можно было хоть по одному дору на 10к страниц делать.

Дешевые VDS - Дешевле некуда! (http://0ll0.ru/4Ta9y)
E
На сайте с 17.02.2008
Offline
150
#72
AESCBC192:
не думал что переоценил способности тех, кто будет качать.
неверно тебе и правда оно не нужно, ты просто потролить зашел, засрать тему чтобы никто скачать не мог ( вместо платного аналога), ну признаяйся) не?)
яш тебе дико не нравлюсь, ты на меня зуб точишь с самого начала моих тредов, ты не соовнер платнных поделок аналогичных?

Эй, зачем так грубо?

Вопросы заданы абсолютно правильные.

Для многих, кто работал с парсерами текста, первым вопросом будет, а по какому принципу парсит - по предложениям, по абзацам, по DOM?

---------- Добавлено 25.02.2017 в 20:14 ----------

sidorka:
Там только гугл, следов 10 парсеров не обнаружено, без проксей толку с такого парсера немного - на поиграться.
Чем обычные readability не устраивают? Статейники они нормально потрошат обычно.

Это ты о каких конкретно?

realefs
На сайте с 27.06.2010
Offline
87
#73
Tecak:
пздц ТС нервный...
чё вы его еще больше накаляете?

именно поэтому

Рубероид дорожает.
sidorka
На сайте с 17.08.2012
Offline
211
#74
extruder:
Это ты о каких конкретно?
AESCBC192:
думом дергает статьи. пс уже не помню какие но штук 10 наверно есть. многопоток и все такое.

Про потрошители статей - мне этот понравился - в виде готового сервера https://github.com/n1k0/readable-proxy Демка - http://readable-proxy.herokuapp.com/

Дешевые домены для дорвеев и не только - от 55р (https://goo.gl/Wtnwqp)
slavok
На сайте с 28.10.2008
Offline
155
#75
slavok, ну не тести. что я тебе еще сакажу, если допилить самому не судьба - можешь денег отлистать за хэпарсер... или ап подождть.

норм у нас диалог получился)

-Вы считаете свой парсер конкурентным по сравнению с платными парсерами?

-Да, конечно!

-Но у Вашего парсера куча недостатков

-Так допили сам, чё до**ался

Это не Вы инженер ваза?) подход просто очень похож))

ПФ. Дорого. Эффективно. В ЛС
twiprogon
На сайте с 22.07.2013
Offline
189
#76

скрипт парсит гугл?

вот наркоман автор

даже качать лень

---------- Добавлено 26.02.2017 в 01:39 ----------

sidorka:
Про потрошители статей - мне этот понравился - в виде готового сервера https://github.com/n1k0/readable-proxy Демка - http://readable-proxy.herokuapp.com/

реально впервые от тебя что то полезное увидел.

отлично просто парсит текст со страниц

LimonBucks.com (http://limonbucks.com) - Лучшие условия для конверта мобильного трафика
sidorka
На сайте с 17.08.2012
Offline
211
#77
twiprogon:
реально впервые от тебя что то полезное увидел.

Прям слезу умиления выбил из меня, подлец. 😂

tapakah2001
На сайте с 25.05.2002
Offline
140
#78

Похвала в детстве - залог успеха во взрослом возрасте! :)

Сущность доров раскрыта! (/ru/forum/comment/14853337)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий