И к чему этот ответ? Если изначально вопрос стоит как раз кардинально обратным образом: умеет ли Гугл переобразовывать видеофрагмент в текст и выводить его в ответе на текстовый запрос пользователя.
Тренировка скилов в сборе семантики без смс и регистрации?