Сдлген

TopperHarley
На сайте с 24.03.2009
Offline
350
7423

Сгенерить полезные статьи для людей, при этом их(людей) не покалечив, задача пока неразрешимая. Разве что написать генератор забавных стихов, тогда получится сайт с каталогизированными стихами. В противном случае остается только парсенный копипаст.

Но как сделать парсенный копипаст полезным для людей?

Информация по какой-то конкретной тематике может быть раздроблена и разбросана в сети. Если ее каталогизировать автоматически, то получится СДЛ. Такая информация иногда бывается остро нужна, но приходится ее по крупицам собирать в сети. Эту задачу мог бы решать сдлген.

Алгоритм примерно такой. Скрипт или программа парсит топ нигмы по одному ключу или списку ключей. Например, ключ этот – птицеводство. Программа переходит по ссылкам топа на сайты, и, находя статьи, собирает и каталогизирует (нерешенный вопрос) информацию себе в базу данных. Делается это периодически, например каждый день. Сразу при этом программа должна отсеивать генерируемые тексты. Отличить генерируемый текст от нормального можно, если учесть статистические показатели нормального текста. Для этого нужно прогнать 1000 образцовых документов или десяток разных художественных книжек через простую программу, которая соберет статистику трехсловников. Это всего лишь 1 критерий, но их можно взять, например, десяток. Этот алогритм можно протестить и собранную статистику применять, чтобы отличать генерируемый текст от человеческого.

Собранный каталог информации дополняется разделами: картинки, видео. Ссылки на картинки и ютубы также собираются парсером.

Каждый материал должен иметь возможность комментироваться. Но с капчей, которую не пробивает срумер. А так как срумер пытается победить рекапчу, то нужно юзать капчи вида: введите только красные цифры. Или только первые 5 цифр или только последние 4 цифры. Такую капчу не пробить ни срумеру, ни анти кап че.

Монетизация будет в зависимости от тематики.

Вопрос в студию: есть ли смысл в этом?

p.s.

Копипасту жить: http://yandex.ru/yandsearch?text=%22%D1%83+%D0%BB%D1%83%D0%BA%D0%BE%D0%BC%D0%BE%D1%80%D1%8C%D1%8F+%D0%B4%D1%83%D0%B1+%D0%B7%D0%B5%D0%BB%D0%B5%D0%BD%D1%8B%D0%B9+%D0%B7%D0%BB%D0%B0%D1%82%D0%B0%D1%8F+%D1%86%D0%B5%D0%BF%D1%8C+%D0%BD%D0%B0+%D0%B4%D1%83%D0%B1%D0%B5+%D1%82%D0%BE%D0%BC+%D0%98+%D0%B4%D0%BD%D0%B5%D0%BC+%D0%B8+%D0%BD%D0%BE%D1%87%D1%8C%D1%8E+%D0%BA%D0%BE%D1%82+%D1%83%D1%87%D0%B5%D0%BD%D1%8B%D0%B9%22&lr=51

PandoraBox - генератор #1 ( https://pandoraboxx.ru ) :: ContentBox - Новый многопточный парсер текста,картинок,видео и т.д. ( https://pandoraboxx.ru/contentbox.php ) :: Конвертор шаблонов WP/DLE ( https://pandoraboxx.ru/templateconvertor.php )
[Удален]
#1

Он писал , старался донести до вас что то важное, но никто не стал это читать. Включая меня

ciber
На сайте с 04.01.2008
Offline
215
#2

Подобный механизм уже есть. Поищи в разделе "Сервисы и программы для работы с SE" или "Веб-строительство"

Но в любом случае СДЛ не выдет. Автомат же...

Хотя тут вот фейк интересный есть. http://www.izvestia.ru/report_nomer/article3112480/

TopperHarley
На сайте с 24.03.2009
Offline
350
#3
true-NuB:
Он писал , старался донести до вас что то важное, но никто не стал это читать. Включая меня

твои посты-пустышки читать интереснее?

Grimich
На сайте с 08.04.2009
Offline
43
#4

TopperHarley, утопия? :)

TopperHarley
На сайте с 24.03.2009
Offline
350
#5
ciber:
Но в любом случае СДЛ не выдет. Автомат же...

Автомат. Роботы собирают телевизоры для людей, почему бы роботам не делать сайты для людей?

TopperHarley добавил 27.05.2010 в 12:45

Grimich:
TopperHarley, утопия?

в каком месте утопия?

ciber
На сайте с 04.01.2008
Offline
215
#6
TopperHarley:
Автомат. Роботы собирают телевизоры для людей, почему бы роботам не делать сайты для людей?

TopperHarley добавил 27.05.2010 в 12:45

в каком месте утопия?

Ну частично ты прав. У Ласто покупал скриптик который по заданым параметрам собирал материал. Но рано или поздно эти псевдоСДЛ улетали в баню. Толи по стуку, толи по фильтру.

akaplenko
На сайте с 09.09.2009
Offline
48
#7
TopperHarley:
Автомат. Роботы собирают телевизоры для людей, почему бы роботам не делать сайты для людей?

Увы, робот собирающий телевизор - это безмозглая железка. :-) тебе же придется делать что-то значительно поумнее. Вообще то можно попробовать, но есть опасность на несколько лет уйти в глухую разработку :-))

Solo_by
На сайте с 19.06.2009
Offline
220
#8
TopperHarley:
Автомат. Роботы собирают телевизоры для людей, почему бы роботам не делать сайты для людей?

Телевизоры копии друг друга. Нет проблем в том чтобы клонировать сайт. А вот сделать уникальный сайт для людей, впрочем как и телевизор, у робота не получится.

strukoff
На сайте с 13.03.2008
Offline
101
#9
TopperHarley:
Автомат. Роботы собирают телевизоры для людей, почему бы роботам не делать сайты для людей?

Идея хорошая, особенно в части с переодическими обновлениями.

Solo_by:
Телевизоры копии друг друга. Нет проблем в том чтобы клонировать сайт. А вот сделать уникальный сайт для людей, впрочем как и телевизор, у робота не получится.

У меня вообще была когда то идея собрать (но к сожалению нет рук, а если есть то они всегда заняты чем то другим) генератор который бы делал сайт (доры, СДЛы, как хотите вообще называйте) не однородные по структуре. Т.е. со встроенным генератором шаблонов и т.п., и так чтобы 1 страница 3-го уровня могла отличаться от другой по структуре. Короче имитацию СДЛов в плане верстки.

П.С. человек тоже своего рода машина, и человеки в 99% случаев работают по аналогии, этому всему можно и робота научить, но каши надо съесть немало.

TopperHarley
На сайте с 24.03.2009
Offline
350
#10
ciber:
Ну частично ты прав. У Ласто покупал скриптик который по заданым параметрам собирал материал. Но рано или поздно эти псевдоСДЛ улетали в баню. Толи по стуку, толи по фильтру.

если сайт нормальный, то его и Шукину показать не стыдно. ну и что что копипаст, зато все в 1м месте собрано и причесано по тегам и рубрикам.

akaplenko:
Увы, робот собирающий телевизор - это безмозглая железка. :-) тебе же придется делать что-то значительно поумнее. Вообще то можно попробовать, но есть опасность на несколько лет уйти в глухую разработку :-))

думаю что за месяц такой софт написать реально. и сильно умного ничего не прийдется делать, я ж почти ТЗ написал.

Solo_by:
Телевизоры копии друг друга. Нет проблем в том чтобы клонировать сайт. А вот сделать уникальный сайт для людей, впрочем как и телевизор, роботу не получится.

да, это вопрос хороший. но я же написал, что такие сайты действительно будут полезны людям, а значит они будут посещаемыми СДЛами. и смысл и нагрузка сдлгена не в том чтобы генерить сайты тысячами, а в том, чтобы парсить просторы инета и добавлять материалы в свой каталог. обновляемость! ну и конечно же не добавлять слишком заезженные материалы, которые и так в индексе присутствуют в количестве свыше Х.

TopperHarley добавил 27.05.2010 в 13:01

strukoff:
так чтобы 1 страница 3-го уровня могла отличаться от другой по структуре. Короче имитацию СДЛов в плане верстки.

нынче доргены и такое умеют. нужны макросы вероятной вставки и макросы гармошки {||||}

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий