Как на Python сделать скрипт расшифровки аудио в текст в реал-тайм?

R4
На сайте с 01.10.2016
Offline
86
435

Здравствуйте.

 

Хочу на Python реализовать расшифровку аудио в текст в реал-тайм на созвонах (например, Google Meet и другие сервисы), через библиотеку Picovoice.

Необходимо программе подавать на вход аудио в реальном времени.

 

Подскажите:

1. Как сделать так, чтобы скрипт прослушивал и звук с микрофона, и звук, выводимый системой (например, браузером)?

2. Вся эта схема может работать через Google Colab?


S3
На сайте с 29.03.2012
Offline
348
#1
rownong4 :

Хочу на Python реализовать расшифровку аудио в текст в реал-тайм на созвонах (например, Google Meet и другие сервисы), через библиотеку Picovoice.

Необходимо программе подавать на вход аудио в реальном времени. 

Задавай конкретные вопросы, а не как сделать. Есть pyaudio для захвата и преобразования. Бьешь входной поток на чанки и получаешь  транслит.

Для захвата используешь системные драйвера или виртуальные, а можно прямо через Pyaudio захватывать

Вот это все не вопрос и выглядит как  - сделайте за меня. Помочь в непонятных местах - пожалуйста. Покажи что не получается, подумаем вместе как решить. Если за тебя - ищи кто за деньги все сделает.

R4
На сайте с 01.10.2016
Offline
86
#2
Sly32 #:

Задавай конкретные вопросы, а не как сделать. Есть pyaudio для захвата и преобразования. Бьешь входной поток на чанки и получаешь  транслит.

Для захвата используешь системные драйвера или виртуальные, а можно прямо через Pyaudio захватывать

Вот это все не вопрос и выглядит как  - сделайте за меня. Помочь в непонятных местах - пожалуйста. Покажи что не получается, подумаем вместе как решить. Если за тебя - ищи кто за деньги все сделает.


Я два конкретных вопроса задал в  теме. Тебе они не кажутся конкретными?

Подскажите:
1. Как сделать так, чтобы скрипт прослушивал и звук с микрофона, и звук, выводимый системой (например, браузером)?

2. Вся эта схема может работать через Google Colab?

Cpt.Smollet
На сайте с 03.08.2024
Offline
9
#3
rownong4 #:
1. Как сделать так, чтобы скрипт прослушивал и звук с микрофона, и звук, выводимый системой (например, браузером)?

- Получаем список аудиоустройств.

- Выбираем для одного потока - микрофон в качестве устройства для аудиозахвата, для другого - "звук выводимый системой"*
*  например, получаем его с виртуального аудиоустройства  типа VAC

- далее обрабатываем  в соответствии с задачами.

Как-то так.

Kwik
На сайте с 11.01.2014
Offline
150
#4
S3
На сайте с 29.03.2012
Offline
348
#5
rownong4 #:


Я два конкретных вопроса задал в  теме. Тебе они не кажутся конкретными?

Подскажите:
1. Как сделать так, чтобы скрипт прослушивал и звук с микрофона, и звук, выводимый системой (например, браузером)?

2. Вся эта схема может работать через Google Colab?

1. Ответил выше. Используй системные драйвера или pyaudio

2. Может

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий