Vladimir-zenno

Vladimir-zenno
Рейтинг
89
Регистрация
22.09.2016
noname
Sly32 #:
Смешно 😀. То есть даже с леммами ты не работаешь? А я еще хотел про вектора и эмбеддинги задвинуть... 
слабоваты попытки пронырливости😎 нас таким не возьмёшь
Sly32 #:
 Ты меня больше запутал, чем обьсянил )) Ты сипользуешь SQLite -   там поиск идет с помощью бинарного дереваТам время поиска O(log n), надеюсь это понятно? Да, для хэша время равно О(1), но эта разница почувствуется только при миллионах записей, с учеом что у тебя база локальная - к ней доступ  очень быстрый. Ну и вообще то данные можно сразу выгружать в виде словарей.  В какой момент у тебя создаются леммы? В базе уже сразу леммы, правильно? Дальше, текст ты тоже привел к леммам и сопоставил таблицу синонимов, правильно?
Дальше ты выбрал слова, которые хочешь синонимизировать. Теперь нужно сделать inflect - обратное преобразование.
Я правильно понимаю суть твоего синонимайзера? 
а я и дальше буду путать, но всё не так, как вы описываете и предполагаете.. вообще не так. да и не надо это пользователям знать, главное результат
так что подробностей раскрывать не хочу, быстро в массы уходит, минуя меня
не хаос #:
Если филологам и лингвистам показать эти поделья, они будут материться наверное.

уже в тг каналах топов принцип Очеловечивания транслируют :)


Sly32 #:
Потому что его нет) Обычные выборки из базы данных, без всякого сложного анализа. Честно - это дипломная работа для студента, не более. Прикольная, но не более
из базы только считывание при загрузке, а далее формируются атомы и молекулы - объекты и Hash таблицы из объектов для моментального перебора, а далее начинается алгоритм. Если такой спец - подумали бы - как оно так быстро может с базы считать и предложить по каждому слову?😁 ну ну..
не хаос #:
Если филологам и лингвистам показать эти поделья, они будут материться наверное.
Некоторые уже успешно пользуются😎 но да, прогресс часто отвергают из-за страха перед необходимостью ломать устоявшийся порядок вещей...
Sly32 #:
Можешь вкратце рассказать об алгоритме, который ты используешь? Просто любопытно, что ты выбрал. Можешь сделать билд под макось? Вообще на чем это все написано?
на c# написано, про алгоритм не могу рассказать

Обновление 3.1.2

- доработки функции Очеловечить 

Наш прогноз на будущее, которое приближается в свете последних событий (прогноз, а не предсказание)

https://www.youtube.com/watch?v=plgu0d4eTJU

(видео подготовлено в Лексикон)

Sly32 #:

Ты не понимаешь о чем я , и твои перефразы об этом хорошо говорят. Ты просто ломаешь все мыслимые грамматические и логические конструкции. 

Я же предлагаю тебе переработать подход  при создании  синонимов. Если ты используешь то, о чем я писал выше, твой синонимайзер не просто будет тупо подбирать цепочки из твоей базы - он будет их строить логически правильно, не нарушая смысла. А уже пользовательна конечном этапе из них будет выбирать то, что ему больше понравилось. Но перефраза и искажения смысла не будет, зато вариантов станет больше. Словарь значительно расширится. Можно сделать его самообучаемым и если тебе понрявился вариант предложенный - добавлять в твою БД. Тогда при последующей генерации будут уже предлагаться и новые варианты.

я понял, работать ещё есть над чем. Хорошо что подталкиваете не засиживаться, спасибо!


Обновление Lexicon 3.1.1

устранили ключевую проблему, связанную с добавлением фраз в текст. Ранее после использования функции «Очеловечить» (которая снижала уровень детекции ИИ-текста, например, с 33% до 0%) последующее добавление фраз могло снова значительно повышать этот показатель. Теперь алгоритм добавления работает интеллектуальнее, внося фразы с минимальными изменениями в структуру и стиль текста. Благодаря этому итоговый текст после правок сохраняет низкий уровень AI-детекции (0% или близкий к тому), что было достигнуто на предыдущем этапе очеловечивания (кроме того что в 3.1.0 эта кнопка вообще поломана была)

архив с программой перезалит

скачать - https://arkhipsoft.ru/Lexicon

Всего: 264