Что может, что не может AI. Обсуждаем возможности, делимся опытом, спорим, но в рамках приличия.

S3
На сайте с 29.03.2012
Offline
341
#461
master32 #:
голос распознается в стриме на лету, задержки минимальные, на том же picovoice

Расскажи поподробнее. Я исключительно на своем маке все запускаю, с игрушками типа распберри дел не имел.

M3
На сайте с 09.02.2022
Offline
82
#462
Sly32 #:

Расскажи поподробнее. Я исключительно на своем маке все запускаю, с игрушками типа распберри дел не имел.

а что рассказывать подробнее, поставь на маке и покрути, сам все увидишь, пока сам не пощупаешь не поймешь)
https://github.com/Picovoice/cheetah
единственный минус, что языков мало, русского нет, нативный английский
но это самая эффективная и легкая модель, которая работает, речь же про слабые устройства шла изначально

S3
На сайте с 29.03.2012
Offline
341
#463
master32 #:
единственный минус, что языков мало, русского нет, нативный английский
но это самая эффективная и легкая модель, которая работает, речь же про слабые устройства шла изначально

Легкая, потому что ничего не умеет. Я использую whisper, medium  модель русский распознает очень хорошо. 

M3
На сайте с 09.02.2022
Offline
82
#464
Sly32 #:
whisper

его запустишь на простых устройствах, нужен полноценный GPU)
vosk можно затестить, тоже легкий

S3
На сайте с 29.03.2012
Offline
341
#465
master32 #:
его запустишь на простых устройствах, нужен полноценный GPU)

Он работает без, GPU, сразу предупреждает об этом, там даже в настройках есть:

self.model = whisper.load_model("medium", device="cpu")

Просто медленнее, как говорил, но зато качественно распознает

Про vosk слышал, но не пользовал

M3
На сайте с 09.02.2022
Offline
82
#466
Sly32 #:
Он работает без, GPU, сразу предупреждает об этом, там даже в настройках есть

ну скорость тоже важна, если это не задачи уровня бекграунда)
https://www.1qubit.de/en/ai/openai-whisper-performance-benchmarks

OpenAI Whisper performance benchmarks
  • 2024.04.21
  • Jens
  • www.1qubit.de
OpenAI’s Whisper is an automatic speech recognition AI system that can recognize speech and convert it into text. The system works amazingly well for the German language and can also be used on local systems. For some time now, we have been developing a solution based on this, aimed at those professional groups who still work with a dictation...
M3
На сайте с 09.02.2022
Offline
82
#467
Sly32 #:

Просто медленнее, как говорил, но зато качественно распознает

ну да, там еще можно свою модель обучить на своем голосе, тогда уровень распознавания еще выше становится

S3
На сайте с 29.03.2012
Offline
341
#468
master32 #:
ну да, там еще можно свою модель обучить на своем голосе, тогда уровень распознавания еще выше становится

я рисовал открытую аппликуху, для использования не только мной. Можно, но это уже нужно заморочиться немного

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий