Дмитрий Подстригаев

Дмитрий Подстригаев
Рейтинг
57
Регистрация
26.02.2019
Интересы
Детекция ИИ, текстовые инструменты, пунктуация, стартапы
Создаю инструменты обработки текста
chaturanga #:
Повторюсь-таки.
Сервис определения AI-текстов на основе AI изначально обречён - недетерминированная гадалка не исполнит роль детерминированного судьи...
Безусловно, но у нас еще поиск источника и сильная база.
Mik Foxi #:
Практический смысл таких анализаторов сомнительный. Поисковикам без разницы, прогнан текст через ИИ или нет. ИИ это неотъемлемая часть человеческой деятельности теперь, и обработка текста через ИИ в основном делает текст лучше, грамотнее во всяком случае.
ЭТО вывод к которому мы тоже пришли!
Нужно делать детектор ПЛОХОГО/ХОРОШЕГО текста, вот и всё. Прямо сейчас мы делаем прототип. Для бизнеса ЭТО то, что надо! Для заказчика типичный ИИ текст и плохой текст, одно и тоже, одинаково бесполезен! Кстати у нас еще есть классический плагиат детектор который показывает техническую уникальность + смысловую уникальность текста, добавленно ли туда какая то ценность или нет, тоже очень полезно. Объеденим ИИ факторы, плагиат, читаемость, обнаружение рерайта, факторы качественного текста, и получится реально практичный инструмент для бизнеса.  Важно что написано, а не кем!

Спасибо за Ваш коммент, прямо отозвалось на 100%

Алеандр #:
Чистое имхо: вы никогда объективно не сможете определить текст как ИИ, имитацию или написанный грамотным копирайтером. Так или иначе, в текстах для веба и медиа есть правила, которые все будут стараться выполнить, что ИИ по промпту, что сам человек, который придерживается этих правил. Выше верно сказали: в качестве анализа "правильного" текста тулза будет сильно полезнее, а в качестве анализатора для выявления ИИ - никогда не будет не то что 100%, а хорошо, если точность останется в районе 60-70%. В общем, полезно, но для других задач.
На 100 процентов подписываюсь! Кто пытаются идентифицировать наверняка, лукавят. Мы это уже поняли.
сейчас в интернете 2 типа детекторов, которые имеют перекос в ИИ, и те которые имеют перекос в "человеческий текст". Мы решили пойти несколько другим путем.

Новый апдейт, определяет реальный юридический текст, или ИИ имитация
Проверка ИИ для юридических документов

Другие детекторы не справляются
Еще пример
И еще

plab #:

Моя же догадка, что гугл показывает вам реальную ценность вашего проекта.

Тогда он должен был вас проконсультировать, что "качество текстов" - понятие относительное. Что хорошо для художественных, то плохо для технических. Как пример. Даже наличие запятых в определенных случаях спорно. Во вторых эксперность нынче подтверждается публикациями, исследованиями. Качество доктора не плохо бы как-нибудь подтвердить. Я к тому, что сервис уже на подходе попахивает дуриловом.

Тут у народа тоже все бесплатно, без лимитов и подписок. Рекламой только сайты зас%р%ют. Если вы не будете, то с какой целью создан проект? Исследовательской? Зачем тогда вам посещаемость с гугла. Яндекс вам нормально дает для тестов.

Смотрите, гугл не просит и не просил никогда за каждый поиск копейку, тогда зачем просить за проверку текста что-то? Другими словами общедоступные полезные вещи должны быть бесплатные, долгосрочная выгода будет в масштабировании и предоставление сервиса другим организациям или бизнесу. Именно так и работаем. К слову сказать google рекламой тоже заполнил выдачу, их прямая выгода, мы уже привыкли просто

plab #:

Удивляет скорее это. 

С трудом верится, что такой сервис кому-то нужен. Да еще "экспертность" обеспечена видимо доктором философии. Проблема не в том, что философии. А то что один чел решает что правильно, идеально, а что нет в вопросах, где не всегда все однозначно.

Яндекс вас протестирует. Если спрос есть, то потом подобный сервис будет у яндекса, а ваш сайт опустят на дно. 

Ну вообще-то доктор филологических наук)  в самую точку. Популярность за счёт того, что нам чудом удалось сделать сервис абсолютно бесплатным и без лимитов. Без подписки.

У Яндекса уже есть спейлер, но он слабоват. Да вполне возможно они сделают, если захотят. Насчет экспертности тут все как раз ок. 

Единственная моя догадка, это фильтр тонкого контента. Мы сосредоточились на бэкенде но нет на сайте пока что раздела с подробной методологией. Добавим, посмотрим. Других догадок нет.

У меня обратная ситуация - сайт бесплатной проверки пунктуации punctuator.ru существует чуть больше года, в Яндексе топ 2-3 по основным запросам, около миллиона визитов в месяц. В Google 0.01% от всего и только по прямым запросам. Фильтр? То есть проблема не в падении от апдейтов, а в том что Google как будто игнорирует сайт. Кто сталкивался с подобным? Хм

jpg screenshot_20260313_225353_chrome.jpg
TonyBlackberry #:

А как это, моих следов не обнаружено, хотя я там полностью наследил, но при этом вероятность, что текст сгенерирован ИИ - всего 35 % ?


Вот кстати тест подобный, наследили и редакционной статье Проверьте еще раз, если не сложно свой текст)
jromka #:
Нужно сделать еще чуть по другому, что бы ссылку на страничку сайта можно было подсунуть, а сервис уже выдал, есть ли там ИИ контент или нет
Отличная идея! Внедрим. Еще хотелось бы в будущем массовую проверку по сайту сделать. Но главное чтобы сайт позволил забрать контент, а не выкинул капчу)
123 4
Всего: 37