sonyps4.ru

Запись под диктовку онлайн. Голосовой набор на Андроид: как включить

Если Вы слишком медленно печатаете на клавиатуре, а учиться десятипальцевому методу набора лень, можете попробовать воспользоваться современными программами и сервисами голосового ввода текста.

Клавиатура, бесспорно, достаточно удобный инструмент управления компьютером. Однако, когда дело доходит до наборки длинного текста, мы понимаем всё её (а, если быть честными, то наше:)) несовершенство... На ней ещё нужно уметь быстро печатать!

Пару лет назад я, желая упростить себе работу по написанию статей, решил найти такую программу, которая бы позволяла преобразовать голос в текст. Я думал, как было бы хорошо, если бы я просто говорил всё что нужно в микрофон, а компьютер печатал вместо меня:)

Каково же было моё разочарование, когда я понял, что на тот момент никаких реально работающих (а тем более бесплатных) решений для этого дела не существовало. Были, правда, отечественные разработки, вроде "Горыныча" и "Диктографа". Они понимали русский язык, но, увы, качество распознавания речи имели довольно низкое, требовали долгой настройки с созданием словаря под свой голос, да ещё и стоили довольно недёшево...

Потом на свет появился Android и ситуация немного сдвинулась с мёртвой точки. В этой системе голосовой ввод появился в качестве встроенной (и довольно удобной) альтернативы ввода с виртуальной экранной клавиатуры. И вот недавно в одном из комментариев меня спросили, есть ли возможность голосового ввода для Windows? Я ответил, что пока нет, но решил поискать и оказалось, что, может и не совсем полноценная, но такая возможность существует! О результатах моих изысканий и будет сегодняшняя статья.

Проблема распознавания речи

Перед тем как начать разбор существующих на сегодняшний день решений для голосового ввода в Windows, хотелось бы немного осветить суть проблемы распознавания речи компьютером. Для более точного понимания процесса предлагаю взглянуть на следующую схему:

Как видим, преобразование речи в текст происходит в несколько этапов:

  1. Оцифровка голоса . На этом этапе качество зависит от чёткости дикции, качества микрофона и звуковой карты.
  2. Сравнение записи с записями в словаре . Здесь работает принцип "чем больше - тем лучше": чем больше записанных слов содержит словарь, тем выше шансы того, что Ваши слова будут распознаны правильно.
  3. Вывод текста . Система автоматически, ориентируясь по паузам, пытается выделить из потока речи отдельные лексемы, соответствующие шаблонным лексемам из словаря, а затем выводит найденные соответствия в виде текста.

Главная проблема, как нетрудно догадаться, кроется в двух основных нюансах: качестве оцифрованного отрезка речи и объёме словаря с шаблонами. Первую проблему реально минимизировать даже при наличии дешёвого микрофона и стандартной звуковой карты. Достаточно просто говорить не спеша и внятно.

Со второй проблемой, увы, не всё так просто... Компьютер, в отличие от человека, не может корректно распознать одну и ту же фразу, сказанную, например, женщиной и мужчиной. Для этого в его базе должны существовать оба варианта озвучки разными голосами!

В этом и кроется основной подвох. Создать словарь для одного человека, в принципе, не так сложно, однако, учитывая, что каждое слово должно быть записано в нескольких вариантах, это получается очень долго и трудозатратно. Поэтому, большинство из существующих на сегодняшний день программ для распознавания речи либо стоят слишком дорого, либо не имеют собственных словарей, предоставляя пользователю возможность создать их самостоятельно.

Я не зря упомянул про Андроид чуть выше. Дело в том, что Гугл, который его разрабатывает, создал и единственный на сегодня общедоступный глобальный онлайн-словарь для распознавания речи (причём многоязычный!) под названием Google Voice API . Подобный словарь для русского языка также создаёт Яндекс, но пока он, увы, ещё непригоден для использования в реальных условиях. Поэтому практически все бесплатные решения, которые мы рассмотрим ниже, работают именно со словарями Google. Соответственно, все они имеют одинаковое качество распознавания и нюансы заключаются лишь в дополнительных возможностях...

Программы голосового ввода

Полноценных программ для голосового ввода под Windows не так уж много. Да и те, которые есть и понимают русский язык, в основном являются платными... Например, стоимость популярной пользовательской системы преобразования голоса в текст RealSpeaker стартует с отметки 2 587 руб, а профессионального комплекса Цезарь-Р аж с 35 900 руб!

Но среди всего этого дорогого софта имеется одна программка, которая не стоит и копейки, но при этом предоставляет функционал, более чем достаточний для большинства пользователей. Называется она MSpeech :

Основное окно программы имеет максимально простой интерфейс - индикатор уровня звука и всего три кнопки: включить запись, остановить запись и открыть окно настроек. Работает MSpeech также весьма просто. Вам нужно нажать кнопку записи, установить курсор в окно, в которое должен выводиться текст и начать диктовать. Для большего удобства запись и её остановку лучше производить горячими клавишами, которые можно задать в Настройках:

Кроме горячих клавиш Вам может потребоваться изменить тип передачи текста в окна нужных программ. По умолчанию установлен вывод в активное окно, однако, можно задать передачу в неактивные поля или в поля конкретной программы. Из дополнительных возможностей стоит отметить группу настроек "Команды", которая позволяет реализовать голосовое управление компьютером при помощи заданных Вами фраз.

Вообще же MSpeech - довольно удобная программа, которая позволяет набирать текст голосом в любом окне Windows. Единственный нюанс в её использовании - компьютер должен быть подключён к Интернету для доступа к словарям Гугла.

Голосовой ввод онлайн

Если Вам не хочется устанавливать на свой компьютер никаких программ, но есть желание попробовать вводить текст голосом, можете воспользоваться одним из многочисленных онлайн-сервисов, которые работают на базе всё тех же словарей Гугла.

Ну и, естественно, первым делом стоит упомянуть о "родном" сервисе Google под названием Web Speech API :

Этот сервис позволяет переводить в текст неограниченные отрезки речи на более чем 50 языках! Вам достаточно просто выбрать язык, на котором Вы говорите, нажать на иконку микрофона в правом верхнем углу формы, при необходимости подтвердить разрешение на доступ сайта к микрофону и начать говорить.

Если Вы не используете какую-либо узкоспециализированную терминологию и говорите внятно, то сможете получить весьма неплохой результат. Кроме слов сервис "понимает" ещё и знаки препинания: если Вы скажете "точка" или "запятая", необходимый знак появится в форме вывода.

По окончании записи распознанный текст будет автоматически выделен и Вы сможете скопировать его в буфер обмена или отправить по почте.

Из недостатков стоит отметить лишь возможность работы сервиса только в браузере Google Chrome старше 25-й версии, а также отсутствие возможности мультиязычного распознавания.

Кстати, на нашем сайте вверху Вы найдёте полностью русифицированную версию этой же формы распознавания речи. Пользуйтесь на здоровье;)

На базе сервиса Гугла существует достаточно аналогичных онлайн-ресурсов распознавания речи. Одним из представляющих для нас интерес можно назвать сайт Dictation.io :

В отличие от Web Speech API, Dictation.io имеет более стильное оформление в виде блокнота. Основным его преимуществом перед сервисом Гугла является то, что он позволяет остановить запись, а затем снова запустить и при этом введённый ранее текст сохранится пока Вы сами не нажмёте кнопку "Clear".

Как и сервис Google Dictation.io "умеет" ставить точки, запятые, а также восклицательный знак и знак вопроса, но не всегда начинает новое предложение с большой буквы.

Если же Вы ищете сервис с максимальным функционалом, то, наверное, одним из лучших в этом плане будет :

Главные преимущества сервиса:

  • наличие русскоязычного интерфейса;
  • возможность просмотра и выбора вариантов распознавания;
  • наличие голосовых подсказок;
  • автоотключение записи после длительной паузы;
  • встроенный текстовый редактор с функциями копирования текста в буфер обмена, распечатки его на принтере, отправки по почте или в Твиттер и перевода на другие языки.

Единственным недостатком сервиса (кроме уже описанных общих недостатков Web Speech API) является не совсем привычный для подобных сервисов алгоритм работы. После нажатия кнопки записи и надиктовки текста, его нужно проверить, выбрать вариант, наиболее соответствующий тому, что Вы хотели сказать, а затем перенести в текстовый редактор внизу. После чего процедуру можно повторить.

Плагины для Хрома

Кроме полноценных программ и онлайн-сервисов, существует ещё один способ распознать речь в текст. Этот способ реализовывается за счёт плагинов для браузера Google Chrome.

Главным преимуществом использования плагинов является то, что с их помощью Вы можете вводить текст голосом не только в специальной форме на сайте сервиса, но и в любом поле ввода на любом веб-ресурсе! Фактически плагины занимают промежуточную нишу между сервисами и полноценными программами для голосового ввода.

Одним из лучших расширений для перевода речи в текст является SpeechPad :

Не совру, если скажу, что SpeechPad - один из лучших русскоязычных сервисов перевода речи в текст. На официальном сайте Вы найдёте довольно мощный (хоть и немного староватый дизайном) онлайн-блокнот со множеством продвинутых функций, среди которых есть:

  • поддержка голосовых команд управления компьютером;
  • улучшенная поддержка расстановки знаков препинания;
  • функция отключения звуков на ПК;
  • интеграция с Windows (правда, на платной основе);
  • возможность распознавания текста с видео или аудиозаписи (функция "Транскрибация");
  • перевод распознанного текста на любой язык;
  • сохранение текста в текстовый файл, доступный для скачивания.

Что же касается плагина, то он предоставляет нам максимально упрощённый функционал сервиса. Установите курсор в нужное Вам поле ввода, вызовите контекстное меню и нажмите на пункт "SpeechPad". Теперь подтвердите доступ к микрофону и, когда поле ввода станет розовым, надиктуйте нужный текст.

После того, как Вы прекратите говорить (пауза более чем в 2 секунды), плагин сам остановит запись и выведет в поле всё, что Вы сказали. При желании Вы можете зайти в настройки плагина (правый клик на иконке плагина вверху) и изменить параметры по умолчанию:

Как ни странно, но во всём Интернет-магазине расширений Гугла мне больше не попалось ни одного стоящего плагина, который бы позволял реализовать голосовой ввод в любом текстовом поле. Единственным похожим расширением было англоязычное . Оно добавляет иконку микрофона ко всем полям ввода на веб-странице, но не всегда правильно располагает её, поэтому она может оказаться вне экрана...

Осуществляется через микрофон. Произнесённые слова - это источник акустических волн, которые представляют собой периодически чередующиеся разряжения и уплотнения окружающего воздуха.

Волна, попадая на микрофон, вызывает на его выходе электрический сигнал определённой амплитуды и частоты. Данный сигнал преобразуется в последовательность прямоугольных импульсов, кодируемых в виде «единиц» и «нулей», и затем может обработан компьютером.

С появлением компьютеров, обладающих достаточной вычислительной мощностью, набор текста голосом в компьютер стал реальностью, благодаря чему удаётся существенно снизить нагрузку на клавиатуру.

Компьютерная технология ввода информации с голоса предусматривает настройку на голоса различных людей. Этот метод называется настройкой компьютера на конкретный голос. Состоит он в следующем. Все слова, которые человек произносит первый раз, компьютер обрабатывает и заносит в свою базу данных в качестве образцов. Когда в дальнейшем человек произносит речь, компьютер мгновенно пытается найти каждое слово в своей базе данных. Сейчас уже существуют современные компьютерные системы, которые без тренировки могут работать с любым голосом.

Применение такой технологии позволяет не только вводить текстовую информацию, но и управлять компьютером с помощью произношение команд.

Когда полезен набор текста голосом ? Он удобен при вводе в компьютер писем, текстов отчётов, сложных научных или деловых документов. Такое средство общение с компьютером будет очень удобно врачам, юристам, журналистам, секретарям, администраторам различного уровня, переводчикам, писателям и многим другим.

Голосовой ввод информации незаменим в тех случаях, когда у пользователя руки оказываются занятыми другой работой, а надо срочно дать компьютеру команду для управления определённых задач. Это может понадобиться операторам на технологических линиях, учёным, медицинским работникам и т. п. Данный метод может оказаться единственно возможным также в том случае, когда основная работа выполняется в затемнённом помещении и ввод данных с клавиатуры затруднён, или человек должен находиться на достаточном удалении от компьютера. Кстати, в этой ситуации возможен ввод данных через радиоуправляемый микрофон. Существует также возможность ввести данные или команды на удалённый компьютер по компьютерной сети.

Как начать пользоваться голосовым набором текста на домашнем компьютере?

Для этого нужно подключить микрофон к компьютеру и перейти на сайт http://speechpad.ru/ Данный онлайн-сервис позволяет набирать текст голосом в голосовом блокноте.

Процесс голосового ввода довольно прост. Выставляем настройки для записи, и можно диктовать текст голосом. Кнопку «Включить запись» используйте для непрерывного ввода текста. Для ввода отдельных фраз или предложений используется значок микрофона.

Друзья, мы продолжаем детальный обзор отдельных новшеств, которыми Windows 10 обзавелась после внедрения крупного обновления Fall Creators Update. И в этой статье хотелось бы уделить внимание обновлённой сенсорной клавиатуре операционной системы. Она была кардинально переработана и пополнилась новыми функциями. Обновлённая сенсорная клавиатура поддерживает режим Swype – когда при наборе текста можно скользить, т.е. проводить пальцем или стилусом, не отрывая его от клавиатуры. Как это давно уже можно делать на мобильных устройствах. Сенсорная клавиатура Windows 10 также пополнилась функцией голосового ввода текста. Если говорить о десктопах и ноутбуках, добавление такой возможности - это, по сути, единственное полезное новшество Fall Creators Update в этой части функционала системы. Однако со штатным голосовым вводом данных не всё так однозначно.

Возможность проговаривать текст в микрофон вместо ручного набора символов на клавиатуре в среде Windows 10 предусмотрена только для английского языка. Microsoft обещает в будущем добавить и другие языки распознавания, однако пока что имеем только то, что имеем. Это, конечно, серьёзное ограничение, и, соответственно, этой функцией смогут воспользоваться только те, кто хорошо знает английский и работает с набором текста на этом языке в серьёзных масштабах. Тем не менее функция интересная, рассмотрим, как её задействовать.

На панели задач Windows вызываем контекстное меню и галочкой отмечаем опцию «Показывать кнопку сенсорной клавиатуры».

Сенсорная клавиатура теперь будет постоянно отображаться в системном трее, откуда её можно запустить в любой момент. При переключении раскладки на английскую на клавиатуре появится значок в виде микрофона. Для диктовки необходимо открыть любое поле ввода текста (любой установленный в системе текстовый редактор, любую программную форму, любую веб-форму в окне браузера). Ну и, собственно, начать говорить в микрофон.

Важный момент: набор текста голосом будет возможен только тогда, когда в системе не отключены речевые службы. Это можно проверить в приложении «Параметры», зайдя в раздел «Конфиденциальность». Во вкладке «Речь, рукописный ввод и ввод текста» должна отображаться кнопка отключения речевых служб. Соответственно, это значит, что в текущий момент службы включены.

В противном случае будет отображаться кнопка включения речевых служб. И её, следовательно, необходимо включить.

Многие из вас очень любят переписываться с друзьями по Viber, WhatsApp, Telegram и Skype. Но, признайтесь, как неохота тратить столько времени на то, чтобы печатать текст вручную. Конечно же, во многих клавиатурах для Android есть такая удобная функция, как набор текста свайпом. Однако, для того, чтобы без ошибок напечатать предложение, нужно все же потратить немало времени. Есть неплохой вариант — голосовой набор текста в Android. Сразу замечу: подойдет не для всех ситуаций. Уверен, вы не захотите проговаривать сообщение вслух в общественном транспорте, на учебе или на работе. Но! Когда вы в компании своих друзей, вы можете себе это позволить. Итак, сегодня о том, как быстро набирать текст голосом в Android на телефоне или планшете.

Настройка голосового набора в Android

Для того, чтобы ваш телефон или планшет понимали вашу речь, нужно сперва немного настроить голосовой ввод. Как вы понимаете, на разных телефонах и в различных версиях ОС Android шаги могут слегка отличаться. Итак:

Закончили с подготовкой.

Одно отступление. Лично я всем советую установить клавиатуру GBoard — Google Keyboard из Google Play . Но это действие не является обязательным для набора текста голосом. Просто удобная и понятная. После установки вам необходимо активировать клавиатуру и выбрать по умолчанию. И еще — зайдите в настройки GBoard > Голосовой набор и добавьте русский язык, чтобы телефон распознавал вашу речь.

Голосовой набор текста в Android: отвечайте на сообщения в Viber, WhatsApp, Telegram, Skype и email в 10 раз быстрее

Теперь запустите приложение-мессенджер (Viber, WhatsApp, Telegram, Skype), емейл-клиент или просто откройте в браузере страницу, на которой вы хотите ввести текст.

Здравствуйте, дорогие читатели! Перед вами самая необычная статья нашего блога, ведь при её написании использовался голосовой набор текста. Поэтому сегодня мы с вами обсудим, как набирать текст голосом.

Это метод набора текста при помощи речи, которая передаётся через микрофон. Эта тема очень актуальная для тех, кто работает с большими объёмами, например, блоггеры, а также люди с ограниченными возможностями. Или для тех, кто ещё не успел овладеть на клавиатуре компьютера.

Сервисы голосового набора

Существуют сервисы, которые работают онлайн, и есть программы, которые устанавливаются на компьютер.

Онлайн-сервисы

  • Speechpad

Это бесплатная разработка Google Chrome, которая, соответственно, работает только в этом браузере. Думаю, с этим проблем не будет, ведь это лучший браузер, и если вы до сих пор им не пользуетесь, то читайте статью про то, . Блокнот можно установить прямо в браузер или пользоваться возможностью набора текста голосом, перейдя на их сайт.

  • Войснот II

Аналогичен предыдущему сервису, также работает только в Google Chrome. Пользоваться им элементарно: выбираем нужный язык и приложение под диктовку само печатает.

  • August4u
  • TalkTyper

Преимущества данного бесплатного сервиса в наличии голосовых подсказок, возможности просмотра вариантов распознавания. Также имеется удобный редактор, с помощью которого вы cможете скопировать полученный материал, распечатать его на принтере, осуществить перевод на иностранные языки или отправить по почте.

Чтобы воспользоваться набором, не прикасаясь к клавиатуре, вам нужно открыть вкладку “Инструменты ”, а затем нажать на “Голосовой ввод…”

Разные команды для редактирования и форматирования пока доступны только на английском языке, но для русского языка поддерживаются пунктуационные команды :

  • «точка»,
  • «запятая»,
  • «восклицательный знак»,
  • «вопросительный знак»,
  • «новая строка»,
  • «новый абзац».

Как показала практика, это очень удобно.

Программы

  • Voco

Платная программа, которая при помощи голоса не только печатает на компьютере и устанавливает знаки препинания, но и радует дополнительными опциями: она умеет аудио, также можно расширить версию словарями (например, с юридическими терминами или другими).

Поддерживается операционными системами, начиная с Windows 7 и выше.
Цена: от 1 690 руб.

  • MSpeech

Бесплатна и может удовлетворить амбиции многих пользователей. Её привлекательность состоит в том, что она может распознавать голос на 50 языках. Для удобного использования есть горячие клавиши, можно самому выбирать источник звука, корректировать распознанный текст.

Плюсы и минусы набора при помощи голоса

Плюсы:

  • Благодаря этим приложениям, фрилансеры могут хорошо подзаработать, занимаясь транскрибацией. Множество заданий такого рода можно найти на бирже Work-zilla , — это излюбленное место новичков в удалённой работе. Вам только остаётся включить программу и чуть позже подкорректировать текст в Word.
  • Экономия времени и сил.
  • Отличная находка для людей с ограниченными возможностями.
  • Для творческих людей выше предложенные сервисы — палочка-выручалочка, все идеи можно быстро записать, просто озвучив голосом, чтобы не забыть.

К сожалению, существуют и минусы при работе с данными сервисами:

  • Если в помещении, где вы надиктовываете, есть посторонние звуки, то распознавание слов и словосочетаний в разы ухудшается.
  • Многие приложения, работающие онлайн, доступны только в браузере Google Chrome.
  • После набора нужно уделить время на редактирование и корректировку текста.
  • Необходимо иметь качественный чувствительный микрофон.
  • Желательно иметь хорошую дикцию, чтобы уменьшить риск возникновения ошибок.

Заключение

Подводя итог данной статьи, можем сказать, что технологии шагнули далеко вперёд, и если раньше всё требовалось печатать вручную, то сейчас это вполне реально делать, просто диктуя информацию голосом. Конечно, нет гарантии идеального распознавания, но прогресс очевиден.

Благодаря развитию приложений, которые значительно облегчают работу удалённым сотрудникам, можно добиться максимальной продуктивности и большей скорости выполняемых задач. Поэтому надеемся, что данная статья поможет вам стать эффективнее в своей работе.

Оставляйте в комментариях ваши отзывы о работе различных сервисов распознавания речи.

Всего вам доброго!



Загрузка...