bolyk

bolyk
Рейтинг
175
Регистрация
16.02.2006
tanir23:
очень интересно, в личку отправлю генерацию провериш?

Скинул результат.

---------- Добавлено 09.09.2016 в 20:08 ----------

exarh:
Ссылку бы.

И что за точность в процентах? То есть %% показывают естественность? Чем ближе к 100 - тем типа больше похоже на человеческую писанину в "глазах" алгоритмов ПС?

Беру 100 статей и проверяю. 98% означает что скрипт угадал 98 из 100 к какому классу они пренадлежат.

---------- Добавлено 09.09.2016 в 20:09 ----------

AESCBC192:
это как? мешанина слов уделывает белый текст?

---------- Добавлено 09.09.2016 в 19:52 ----------

bolyk, вы не просто дисперсию по стандартному распределению смотрите?

Да, но только частично, ибо только по ней, процент определение класа статьи мизерный.

AESCBC192:
Что за софт? Нейронка?

Ну, можно и так сказать, ибо нужно обучать.

В среднем точность такова:

Синоними - 76%

Яндекс.Реффераты - 75%

ПС Сниппеты - 90%

Марков - 93%

Маркс - 94%

Морфологически верный текст по одному из генераторов(не Пандора, Топпер не дал текста🙅) в этой ветке - 100%

Мешанина из слов - 98%

Белая статья - 96%

Размножение - не тестировал, но думаю, как и синоними.

По дорам в ПС ситуация разная, если обучен данным типом - то до 100%, даже если морфология.

К сожалению, с какой проблемы начал такой и закончил - писать анализатор это НЕ генератор писать.

ПС: Скоро покажу сервис, уже все готово.

Прошу отписаться клиента, который оплачивал с карты на Яндекс.Деньги. Вы в примечании не указали почту. Не знаю куда скрипт скинуть.

ПС:

Актуальная цена на супер дорген - всего 50уе.

AESCBC192:
Если не сложно, запостите примеры генераци текста, самого высокого качества из того, чт известно вам, достаточно 300-500 символов, то есть 2-3 предложения. необходим ориентир для настройки алгоритма.

Так в том и дело, что есть софт для определение естественности, а не для генерации текста.

Скиньте пару(лучше десятков) статей, я проверю:)

AESCBC192:
Если стоит задача обойти признаки по которым идет бан, то почему не создать своего банбота, обучить его на уже имеющихся забаненых сайтах и им проверять, это сэкономит массу вермени и доменов тоже.

Ну, допустим написал я бота, который с довольно высокой точность определяет естественность текста на странице.

Это все равно не решает проблему с уходом юзера с Дора.

Adrian2012:
для организации такого сервиса достаточно внятного словаря синонимов.
А такого словаря, несмотря на модность фриланса, копирайтинга, дорвееводства, в рунете до сих пор еще не выродили. Хотя пытались еще лет 10 назад...

какая там нейросеть...окститесь....


З/Ы. О чем я собсвтенно говорю - даже в Буржнете такого нет.

Просто поверьте на слово, даже самого толкового словаря не хватит 😂 Морфология(по Церберу) тоже, легко определяется. Сниппеты, мешанина ключевых слов, Марков и стыковки по запятым... Все это определяется довольно успешно.

Прошу не принимать как конкуренцию, просто самому интересны эти темы.

Топпер, большая просьба скиньте десяток второй текстов по этому алгоритму. pandoraboxx.ru/syntaxtextgen.php

Спасибо.

Уважаемые, кому не сложно скиньте сотню другую файлов текстовки, от 500 до 3000 символов. Очень нужно.

Спасибо большое.

twiprogon:
bolyk, блин, ты как вастменеджер стал, везде свой товар/услугу навязываешь)

Все, больше не буду.☝

realefs:
говорите в этом сезоне в моде грибок? 🤪

Я не причем. Картинка такая попалась.😂

Всего: 935