Сдлген

olegapro
На сайте с 29.07.2007
Offline
139
#51

Не забивай, идея хорошая, если будет реализован тот функционал, который намечен, я бы выложил 100-200$ за софт.

Статьи для новичков по дорвеям (/ru/forum/717895) Мой Новый Блог (https://olegapro.com)
L!mur
На сайте с 26.06.2006
Offline
176
#52
ciber:
Куда мир катится? дорвещики СДЛ собрались делать

Неее, это белые делают СДЛ, а дорвейщики собрались их массово генерировать 😂

10'000 руб/сутки на SEDv4 «MobyDick»! (/ru/forum/comment/12653555) Нужен трафик? Купи «SED» (http://www.sedv4.ru) 5'000 руб/сутки на SEDv3 (/ru/forum/comment/11641425) Для работы с Twitter только TwiFarmv3! (/ru/forum/839117)
spambot
На сайте с 12.12.2008
Offline
55
#53
olegapro:
Не забивай, идея хорошая, если будет реализован тот функционал, который намечен, я бы выложил 100-200$ за софт.

чем это лучше интеграции advego,etxt с какой нить цмс и автопокупкой рерайт статей на заданную тематику? :)

Every time you attempt to parse HTML with regular expressions, the unholy child weeps the blood of virgins, and Russian hackers pwn your webapp. (http://stackoverflow.com/questions/1732348/regex-match-open-tags-except-xhtml-self-contained-tags/1732454#1732454)
TopperHarley
На сайте с 24.03.2009
Offline
350
#54
eugene0280:
пока сами смутно знаем, чего хочем, или наоборот.

смутно хочем чего знаем )

PandoraBox - генератор #1 ( https://pandoraboxx.ru ) :: ContentBox - Новый многопточный парсер текста,картинок,видео и т.д. ( https://pandoraboxx.ru/contentbox.php ) :: Конвертор шаблонов WP/DLE ( https://pandoraboxx.ru/templateconvertor.php )
alexandr_nv
На сайте с 23.04.2009
Offline
39
#55

ТС замухнулся слишком высоко... Это как создать ИИ, чтобы потом обучить его делать для вас яичницу. Игра не стоит свечь.

akaplenko:
Если у вас это получится лучше или вы сможете придумать принципиально другие алгоритмы для определения относится ли документ к этой тематике без участия человека с большим % вероятности попадания, то нме кажется вы станете очень богатым человеком :-)

+1

И это лишь одна из задач. Нужно ещё определять "полезность" статьи.

Возьмем тематику "птицеводство". Как программа определит по каким ключам нужно парсить статьи? (Тупо парсинг всего наиболее популярного сайта этой тематики исключаем). Если по вордстату посмотреть ключи со словом "птицеводство" - то будет, например, запрос "птицеводство скачать", по котому яндекс и гугл выдадут на первой позиции описание книги. Как программа определит, что это парсить не нужно?

TopperHarley
На сайте с 24.03.2009
Offline
350
#56
alexandr_nv:
И это лишь одна из задач. Нужно ещё определять "полезность" статьи.
Возьмем тематику "птицеводство". Как программа определит по каким ключам нужно парсить статьи? (Тупо парсинг всего наиболее популярного сайта этой тематики исключаем). Если по вордстату посмотреть ключи со словом "птицеводство" - то будет, например, запрос "птицеводство скачать", по котому яндекс и гугл выдадут на первой позиции описание книги. Как программа определит, что это парсить не нужно?

главный ключ - это тема сайта, разделы - это СЧ, материалы - НЧ. парситься из вордстата и потом парсятся материалы сайтов по ключам + список стоп слов, в котором будет и "скачать"

E0
На сайте с 24.06.2008
Offline
17
#57
Как программа определит по каким ключам нужно парсить статьи? (Тупо парсинг всего наиболее популярного сайта этой тематики исключаем). Если по вордстату посмотреть ключи со словом "птицеводство" - то будет, например, запрос "птицеводство скачать", по котому яндекс и гугл выдадут на первой позиции описание книги. Как программа определит, что это парсить не нужно?

Придется втыкать вручную стоп-слова. Так же, мне кажется, % кивордов парсируемого текста...

Хостинг под сателлиты. Дешевле и надежнее нет (http://http://tinyurl.com/ybrqyof) Заработай на хлеб и черную икру. (http://smsconvertv3.ru/?refid=548)
TopperHarley
На сайте с 24.03.2009
Offline
350
#58

как ни крути без вордстата не обойтись, ведь мы делаем не СДМ - сайт для меня, где ключи будут вида "как я кастрировал золотую рыбку", а нужны поисковые, используемые людьми запросы, значит без ключей никак не обойтись в этом нелегком деле ) а дальше дело техники ) парсим, анализируем, фильтруем, добавляем.

самый сложный вопрос - это определение тематики, кто что подскажет об этом?

ciber
На сайте с 04.01.2008
Offline
215
#59
L!mur:
Неее, это белые делают СДЛ, а дорвейщики собрались их массово генерировать 😂

Мдя... массовое размножение контента? Еще значит не все темы убили, добрались до СДЛ?

Solo_by
На сайте с 19.06.2009
Offline
220
#60
ciber:
Мдя... массовое размножение контента? Еще значит не все темы убили, добрались до СДЛ?

Да, мы будем генерить СДЛ пока не появится термин, нСДЛ - нормальный СДЛ)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий