Дмитрий Подстригаев

Дмитрий Подстригаев
Рейтинг
57
Регистрация
26.02.2019
Интересы
Детекция ИИ, текстовые инструменты, пунктуация, стартапы
Создаю инструменты обработки текста
TonyBlackberry #:

А как это, моих следов не обнаружено, хотя я там полностью наследил, но при этом вероятность, что текст сгенерирован ИИ - всего 35 % ?

Это была промежуточная версия кстати, сейчас немного по другому.
Сергей Науров #:
Протестировал, может, не очень детально, но достаточно, чтобы сделать первые выводы. Тексты ИИ, написанные с шаблонным промтом, определяет как ИИ-шные почти во всех случаях, то есть работает. Если текст был написан ИИ с более подробным промтом, конкретной идеей текста и т. д., то не определяет. Но хочу сразу сказать, что и другие детекторы это не определяют.
Да, безусловно. Спасибо за обратную связь! У нас в команде за 2 дня огромный прогресс по методологии, уже научную работу писать можно)
Сергей про е-ком #:

Тестанул, одни ошибки на нормальном тексте от толкового редактора и Ai. 

Начало: пишет ошибку, что между первым заголовками идёт вводная часть. Де факто - это стандарт записей.

Синтаксис: адекватные люди прогоняют текст через анализаторы + вычитывается статья. В обоих случаях получил: текст скользит.

Энциклопедия: никакой нормальный автор не напишет: где-то в 2018. А тут это как пример отсутствия ошибок. Тем более в тексте отсылка к документу.

Порезка на куски: опять же, это стилистическое правило. Лимит символов и предложений. Это называется юзабилити. )

Кавычки - нормальные владельцы сайтов лет так много пускают текст через типограф или аналоги. Это не критерий Аи.

Про градус накала - это вообще что такое? Как понять выгорает и бесится? Редактор и автор за это деньги получает.

Де факто: назвать надо не анализатор Ai, а анализатор качественного текста.


В общем мы кардинально решили ситуацию, разделив оси: отдельно происхождение (есть ли источник), отдельно степень автоматизации, отдельно редакторская обработка. Теперь строгий, вычитанный текст не наказывается за профессионализм. А так да, я проверил другие детекторы, это предел детекции, но мы пошли дальше, ищем источники. Очень сложно с текстами, которые по определению похожи на ИИ... во многом это профанация точно заявлять, что это текст сгенерирован, поэтому мы даем более осторожную оценку теперь текстам по осям. 
Pavel A #:

А вот добавка

Но.. Это не человек. Это имитация 😁

Для шаблонных текстов нейросеть хорошо определяет нейросеть.

Кстати я посмотрел, реально диалоги стилизованные пропускает как оригинал. Очень интересно) нужно разобрать феномен. Но Ваш текст посмотреть не могу, не сохраняем ничего от пользователей . 

Вообще то что мы делаем поддается обходу, безусловно,  мы писали об этом в методологии , я не видел идеальных ИИ детекторов, одни кричат на оригинал что это ИИ, другие говорят что чистый рукопис. Но если научимся определять хотябы 80-90% текстов, уже победа 

Pavel A #:

А вот добавка

Но.. Это не человек. Это имитация 😁

Для шаблонных текстов нейросеть хорошо определяет нейросеть.

Ничего) тоже поймаем в будущем) мы много работаем над выявлением имитации именно. Спасибо большое за обратную связь, очень ценно 

Pavel A #:

Привет от GPT. Хотя без промпта типа определило.

Интересный кейс

Сергей про е-ком #:

Тестанул, одни ошибки на нормальном тексте от толкового редактора и Ai. 

Начало: пишет ошибку, что между первым заголовками идёт вводная часть. Де факто - это стандарт записей.

Синтаксис: адекватные люди прогоняют текст через анализаторы + вычитывается статья. В обоих случаях получил: текст скользит.

Энциклопедия: никакой нормальный автор не напишет: где-то в 2018. А тут это как пример отсутствия ошибок. Тем более в тексте отсылка к документу.

Порезка на куски: опять же, это стилистическое правило. Лимит символов и предложений. Это называется юзабилити. )

Кавычки - нормальные владельцы сайтов лет так много пускают текст через типограф или аналоги. Это не критерий Аи.

Про градус накала - это вообще что такое? Как понять выгорает и бесится? Редактор и автор за это деньги получает.

Де факто: назвать надо не анализатор Ai, а анализатор качественного текста.

Вот это нереально  полезно, Вы правы во всем! Без исключения , следующий апдейт будет изменение алгоритма ПРОФЕССИОНАЛЬНЫЕ ПРАКТИКИ ≠ ИИ. Будем считать по совокупности факторов.

Хороший текст без ошибок — это не обязательно ИИ, но хороший текст без позиции, конкретики, лишней детали, без "слепых пятен" и прочих явных признаков присутствия живого автора - вот это 99.9.  а так я согласен на 100%, многие критерии в методологии вспомогательные, доп подтверждения. Ну как-то так.  Спасибо за ценнейшую обратную связь, мы будем исправлять методологию,что бы не быть детектором корректного текста) 

Mik Foxi #:
текст который я сам писал и даже не проверял и не правил в ИИ признан полностью ИИшный на 90% 😀

Проверьте плиз ещё раз, внесли изменения. А кстати длинный или очень короткий текст был? Не тестили ещё на очень коротких

Уже пофиксили) фикс первого дня как говорится. Благодарен за обратную связь!

Прошу прощения владелец сайта что-то на химичил. До этого такой проблемы не было само собой.
123 4
Всего: 37