Скинул результат.---------- Добавлено 09.09.2016 в 20:08 ----------
Беру 100 статей и проверяю. 98% означает что скрипт угадал 98 из 100 к какому классу они пренадлежат.---------- Добавлено 09.09.2016 в 20:09 ----------
Да, но только частично, ибо только по ней, процент определение класа статьи мизерный.
Ну, можно и так сказать, ибо нужно обучать.
В среднем точность такова:
Синоними - 76%
Яндекс.Реффераты - 75%
ПС Сниппеты - 90%
Марков - 93%
Маркс - 94%
Морфологически верный текст по одному из генераторов(не Пандора, Топпер не дал текста🙅) в этой ветке - 100%
Мешанина из слов - 98%
Белая статья - 96%
Размножение - не тестировал, но думаю, как и синоними.
По дорам в ПС ситуация разная, если обучен данным типом - то до 100%, даже если морфология.
К сожалению, с какой проблемы начал такой и закончил - писать анализатор это НЕ генератор писать.
ПС: Скоро покажу сервис, уже все готово.
Прошу отписаться клиента, который оплачивал с карты на Яндекс.Деньги. Вы в примечании не указали почту. Не знаю куда скрипт скинуть.
ПС:
Актуальная цена на супер дорген - всего 50уе.
Так в том и дело, что есть софт для определение естественности, а не для генерации текста.
Скиньте пару(лучше десятков) статей, я проверю:)
Ну, допустим написал я бота, который с довольно высокой точность определяет естественность текста на странице.
Это все равно не решает проблему с уходом юзера с Дора.
Просто поверьте на слово, даже самого толкового словаря не хватит 😂 Морфология(по Церберу) тоже, легко определяется. Сниппеты, мешанина ключевых слов, Марков и стыковки по запятым... Все это определяется довольно успешно.
Прошу не принимать как конкуренцию, просто самому интересны эти темы.
Топпер, большая просьба скиньте десяток второй текстов по этому алгоритму. pandoraboxx.ru/syntaxtextgen.php
Спасибо.
Уважаемые, кому не сложно скиньте сотню другую файлов текстовки, от 500 до 3000 символов. Очень нужно.
Спасибо большое.
Все, больше не буду.☝
Я не причем. Картинка такая попалась.😂