В основе «Яндекс.Диктовки» лежат разработанные в IT-компании технологии распознавания речи, а также библиотека распознавания голоса под названием SpeechKit, впервые анонсированная ещё в конце 2013 года.
Запись голоса в приложении активируется с помощью специальной команды «Яндекс, записывай». Получив такую команду, программа начинает записывать следующей за ней произвольный текст, наговариваемый пользователем, в некоторых случаях расставляя между словами необходимые знаки препинания.
Отдельные голосовые команды также предусмотрены для редактирования текста. Приложение можно попросить добавить весёлый смайлик, удалить последнее слово, заменить одно слово на другое и начать с новой строки.
Завершив диктовку, пользователь с помощью команды «Прочитай всё» может прослушать, что получилось. За это отвечает встроенная в приложение технология синтеза речи от «Яндекса».
В дальнейшем текст можно скопировать в буфер обмена, сохранить в виде заметки, а также использоваться в SMS или в качестве комментария в одной из социальных сетей.
При этом копировать текст из приложения вручную не придётся: весь текст сохраняется в заметки автоматически, а в сторонние программы его можно перенести несколькими командами: «отправь SMS», «отправь в твиттер» и «отправь письмо».
В первой версии «Яндекс.Диктовка» доступна только для пользователей устройств на Android. Скачать приложение можно через магазин Yandex.Store.
Как подчёркивают в «Яндексе», программа пока является демонстрационной и рассчитана на распознавание голоса одного человека. Записать с её помощью интервью и другую спонтанную речь нельзя.
Библиотека SpeechKit была представлена «Яндексом» в ходе предыдущей «Yet Another Conference». Технология позволяет использовать речевые технологии IT-гиганта в программах для iOS, Android и Windows Phone. По данным компании, в настоящее время SpeechKit используется примерно в 500 приложениях.
Источник: TJournal