Простой вопрос к программистам под смартфоны

oleg1979
На сайте с 23.07.2010
Offline
187
554

А реально сделать программу которая бы в реальном времени качественно слушала что происходит с хозяином телефона и перекодировала бы это в текст? Что-то типа голосового гугл-поиска только реалтайм (единственно я не знаю как гугл слова декодирует - посылает звук в интернет на свой сервер или где-то с телефона).

Если да то сколько такое может стоить?

Консультирую по всем вопросам, связанным с запуском интернет-магазина
[Удален]
#1

Дохрена

Очень дохрена

O3
На сайте с 17.11.2008
Offline
127
#2
oleg1979:
что происходит с хозяином телефона и перекодировала бы это в текст

Может лучше в эмоции сразу?

Какой сейчас век кстати?

BG
На сайте с 03.10.2010
Offline
195
#3

Вроде же есть программы для распознавания речи, вот дипилить их может как-то чтобы логи вела. Но это чисто гипотетически, как на практике будет не знаю.

И второй вопрос, качественно, наверное, не получится слушать если телефон находится далеко от источника звука.

-= Сайты на заказ | Правки, обновление, работы по DLE =- ( /ru/forum/791118 ) Telegram: @ruslansh ( tg://resolve?domain=ruslansh )
B
На сайте с 02.05.2007
Offline
240
#4

программ для распознавания речи НЕТ

Dragon Dictate загнулся программой

онлайн сервис - когда постоянно обучается - да, есть,

но его максимальный успех - словосочетания

oleg1979
На сайте с 23.07.2010
Offline
187
#5

balueff, а как тогда работает голосовой google поиск?

B
На сайте с 02.05.2007
Offline
240
#6
oleg1979:
balueff, а как тогда работает голосовой google поиск?
онлайн сервис - когда постоянно обучается - да, есть,

или он уже оффлайн работает? :)

вопрос про siri будет следующим? 😂

oleg1979
На сайте с 23.07.2010
Offline
187
#7
balueff:
или он уже оффлайн работает? :)

вопрос про siri будет следующим? 😂

Ну оффлайн есть - там какая-то программа для голосового написания смс есть.

Хорошо. А если взять базу из 1000 наиболее часто встречаемых слов, каждое слово по произношению это 10 кб на 10 вариантов произношения. Т.е. база для распознавания будет около 100 мб весить + сам движок распознавания.

Я нашел данные что гугл поиск жрет много трафика и работает на скорости бОльшей, чем VOIP. Яндекс с его распознаванием 1 слова, а не фразы трафика кушает на много меньше.

B
На сайте с 02.05.2007
Offline
240
#8

киотокиотокиотокиотокиотокиото

ну распознай, сколько раз и какой город тут произнесен :)

киото - легко

токио - легко

два и более слов подряд - 100 Мб не отделаешься :)

Авторизуйтесь или зарегистрируйтесь, чтобы оставить комментарий