скрипт то я давно уже удалил с сервера...., а вот тему немогу
ну сайт болезней.ру - это не сайт для людей. там сейчас нет сайта как такового. Пару страниц и всё. Сайты для людей я делаю с мин. 70% информации уникальной.
Контент с моих сайтов воруют часто, но позиции сайтов не падают =)
А касаемо подставы для разработчиков - вы так об этом печётесь, как будто вы и есть разработчик этого софта.
Спс. Отличная прога.
Я не заступаюсь, я просто хочу пользуясь поиском получать релевантную инфу, а не дорвей, на котором кроме партнёрок нету нечего.
Я раньше тоже генерил доры тоннами - пока из школьнега не вырос. И стал делать сайты для людей - могу сказать, что они приносят $ в 3-5 раз больше, чем доры.
Даже засвечу один из доров www.creditov-mnogo.ru - он приносил по 10-20 wmz в сутки с бегуна чуть больше полугода назад, пока не умер. Да, время и инвестиции на его создание по сравнению с нормальным сайтом отличаются в несколько раз, но за то я теперь не думаю о том, что мой сайт могут забанить и доходы упадут, а я просто еду отдыхать, и по приезду я уверен, что за это время деньги уже набежали на партнёрках, sms сервисах и других услугах.
Я разве не прав?
Я не мерил в символах, я в размере txt файла мерял =)
Время тратится изначально на подготовку словаря:
1. Подбор ключевых слов для поиска контента
2. Ищет, выкачивает - тут уже всё зависит от кол-ва которое необходимо
3. Парсит html to text - быстро
4. Составляет словарик и строит коркондансы - в среднем 10-30 минут в зависимости от кол-ва текста, которое ему дали.
5. По базе синонимов и толкованию - словарь прогоняет меньше минуты.
6. Ручная корректировка словарика - максимум, что у меня занимала 2 часа
7. А тут всё зависит от выбора, что сначала сделать - морфологический или синтаксический анализ.
8. Примерно файл в 1 Мб обрабатывает в течении 1 - 30 минут - из за сложности построения некоторых предложений. Программа ещё не умеет, строить смысловые связи, да я ещё и не придумал как это правильно сделать, а описания такого алгоритма я не нашёл. Думаю это сможет ускорить работу с текстом. И составлять более грамотные текста с использованием предложений из разных файлов.
На выходе получаем файл с текстом:
Было:
Интенсивность ожирения бывает различной. Жировые отложения нарастают на туловище, затылке, бедрах, плечах, в тазовой области. Из-за скопления жира ограничена подвижность диафрагмы, что уменьшает жизненную емкость легких и затрудняет приток крови к сердцу. Жировые отложения на сердце также мешают его деятельности.
Стало:
Бывает интенсивность увеличение веса разной. На туловище и затылке увеличиваются скопления жира, а так же бедрах, плечах и в тазовой области. Свободное движение диафрагмы препятствуется жировыми отложениями. Скопления жира на сердце препятствуют его деятельности. Это ограничивает поток крови к сердцу и снижает объем органов дыхания.
Не смог найти оригинал. Запустил софтину на пару предложений. В данном случае текста получились нормальные, так как по "медицинской" тематике собран большой словарик. В тематике "кредиты", тоже почти всё более мение. В тематике спорт, порой делает смешные предложения.
cromizer добавил 27.08.2008 в 14:23
Программа и там приносит мне ощутимую пользу, позволяет гораздо быстрее, мне и контент-менеджеру, обновлять сайт при отсутствии информации для обновления. А так же генерировать статьи для постинга в каталогах статей .
Я тоже видел немерено разработок, но все они заканчивались либо просто на тупой замене слов, максимум что использовалось морфологический разбор.
Правда видел я одну разработку, которая строила текста на основе шаблонов
[профессионал в области] - шаблон характера сабжа
[(полиграфии) и (производства печатной продукции)] - принадлежность характера
[давно] - положительное наречие
[зарекомендовавший себя как] - причастный оборот
[надежный партнер] - положительный характер
которые строились после анализа 1 какой нить статьи, и использую словарь (идея составления словаря - мною была взята от сюда) и морфологию строился текст. Но, почему то, проект был заброшен, хотя мысль довольно интересная и возможно, по скорости работы гораздо быстрее моей. Но имеющая ряд ограничений по синтаксису. Хотя 100% яндекс и все остальные ПС будут хавать этот текст.
Сложность заключается в определении изменения части речи, в зависимости от того или иного слова или фразы при синтаксическом изменении.
Сейчас найду исходник одной из статей. И выложу.
Можно по экономить на ссылках типа www.sait.ru, если попросить друзей и подруг поставить из своих аккаунтов в социалках, кот. индексируются, ссылку на сайт - типа я рекомендую и тд.
Я не выводил, у меня доменов в бане гугла просто не было. Не знал, что с этим есть сложности.
У меня знакомый как то выводил и кидал ссылку на блог, вдруг пригодится, где чётко расписан план мероприятий, для вывода домена из бана. Единственное, что если мне не изменяет память, не раньше чем через месяц, стоит туда писать. Я сейчас поишю ссылку в хистори....
А я не барыжу. Я поделился бесплатно. Я не нарушил правила форума.
А раз Блогорама платный скрипт, то почему он на DLE-шных новостных сайтах лежит бесплатно? Да потому что, продавать дорвеи - зло. И писать софт, который будет их создавать 100000000-ми и засорять поиск. И так сложно найти что либо, дак ещё и кучу доров перекликаешь. А чем быстрее народ начнёт массово юзать его, тем быстрее Яндекс начнёт фильтровать его.
cromizer добавил 27.08.2008 в 12:46
Я антивир тоже покупаю и ещё ряд программ.... - проще купить, не желе искать кряк и тд.
😂 - ты уверен в своих словах? ты читал о возможностях? и ты видел результаты работы?
или ты на столько самоуверен, что не можешь смериться с тем, что человек, у которого рейтинг на форуме 10 и он на нём 1 день, может выложить, то что не смог сделать никто на форуме, или смог, но молчит.
Перечитай ещё раз пост повнимательнее, там расписано, что реализовано и посмотри результат http://bolezney.ru/vnutr_ojerenie.html
А то, что написать синонимизатор может только серьёзная контора со штатом программеров - хрень полная. Программеров может быть хоть 10, но если у них нет знания и понимания того, как можно сделать семантический расклад текста, или как составить смысловое дерево или как использовать морфологию - то они никогда не напишут. А технически софт пишется за 15 дней (мне его столько писали, на основании чёткого ТЗ).
И мой тебе совет - не суди без повода и не принимай поспешных решений, основываясь на эмоциях. Ты же оптимизатор - где логическое мышление? Или сайты ты продвигаешь так же как и делаешь выводы?
И