Ало? Вас слушает Google!
Google предложил забыть о кнопочных и сенсорных клавиатурах в телефонах, и запустил русскоязычный голосовой поиск. Бесплатное приложение можно скачать для Android, iPhone и Nokia на Symbian S60, а вот Windows Mobile осталась в пролете!
В России стартовал необычный и весьма удобный сервис Google для мобильных телефонов – голосовой поиск. Многие, наверное, вспомнят ситуации, когда нужно было срочно найти какой-то адрес, телефон или иную информацию на улице, на ходу, под дождем, в автомобиле и т.д. Насколько же неуклюжей становится в таких случаях привычная кнопочная или сенсорная клавиатура! Так вот, отныне поиск в Google на мобильном устройстве должен стать удобным и безопасным и в "экстремальной" ситуации, и сидя на диване! Нажал на экране кнопочку с микрофоном, произнес запрос "статистика использования синхрофазотронов", и в строке поиска появилась эта фраза - 41 знак фактически одним этим кликом! Неплохо, не правда ли?
Сервис голосового поиска для мобильных устройств не новинка – он существует уже не менее года для английского, французского, немецкого, испанского, итальянского, польского, чешского, а также азиатских языков - китайского, корейского и японского. Но для отечественных пользователей до сегодняшнего дня сервис был бесполезен, ибо не поддерживал русский язык. Теперь же он поддерживается, и русскоязычный голосовой поиск заработал на коммуникаторах с операционной системой Android, смартфонах Nokia на базе Symbian S60 и, конечно же, iPhone. Владельцы этих девайсов могут уже сейчас скачивать и устанавливать соответствующие их телефону приложения.
СПРАВКА F5
Первые упоминания о голосовом управлении касаются еще доэлектрической эпохи, ибо общение с машинами на человеческом языке – давняя мечта и фантазия человечества. Первая аппаратура, распознающая отдельно произнесенные буквы, разработана в 50-х годах ХХ века.
Однако реально, а не условно действующие системы стали появляться лишь около 15 лет назад, после появления специализированных компьютерных программ распознавания голоса. Полноценное распознавание обычной разговорной речи – сложная задача, требующая значительных вычислительных мощностей, поэтому компьютер в этой сфере вне конкуренции. Впрочем, компьютер нужен не всегда – существуют и упрощенные системы. Они способны распознавать лишь несколько заложенных в них слов или фраз, без адаптации к разным условиям и требующих идеально четкого произношения. Подобное применяется для управления бытовой техникой, вроде стиральных машин. Перспективное направление – голосовое управление в автомобиле (разумеется, речь не идет о вращении руля – голосом удобно управлять аудиосистемой, климатом и прочими второстепенными функциями).
Амир Мане, специалист отдела речевых технологий Google:
- В мобильном приложении голосового поиска реализована модная сейчас система "облачных вычислений". Касается это, разумеется, не поиска в Гугле, который каким был, таким и остался. "Облачные вычисления" используются для решения самой сложной задачи – распознавания голосового запроса.
Евгений Вайнштайн, разработчик ПО Google, один из авторов технологии распознавания речи на русском языке:
- Нами была проведена огромная научная работа. Мы составили базу из более чем миллиона русских слов, которые произносились во множестве различных вариантов – мужскими и женскими голосами, с акцентом, в условиях шума улицы, метро, автомобиля и многих других помех, и т.д. И база эта продолжает постоянно пополняться.
Помимо этого система распознавания обладает определенным интеллектом. То есть, если была нечетко сказана часть фразы, которую человек бы все равно трактовал бы однозначно – например "смотреть видео онлайн", слово "онлайн" не будет перепутано системой со схоже звучащими – например, "дизайн" или "комбайн" :-). Базы составлялись в первую очередь на основании обычных запросов в обычный же Google – тех, что люди делают при помощи клавиатуры ноутбука или десктопа. Поэтому "распознавалка" поймет, что под неразборчивым словом во фразе "смотреть видео....." пользователь подразумевал именно "онлайн".
F5 в числе первых протестировал новую услугу на Android-смартфоне. Поиск выполняется почти безупречно, а вот канал связи способен подпортить впечатление. Голосовой запрос на поиск отправляется на сервер по любому интернет-каналу – Wi-Fi, 3G или GPRS. Первые два типа подключения обеспечивают практически мгновенный ответ, GPRS же изрядно подтормаживает.
Программа в мобильнике отправляет на расшифровку пакет данных, который занимает в среднем 100 килобайт. Если запросы эпизодичны – большого вреда кошельку это не нанесет, но если вы сёрфите в Сети с целью убить время – можно несколько поистратиться. А в роуминге особенно. Поэтому для всех современных мобильных технологий наиболее логичен безлимитный мобильный Интернет
СПРАВКА F5
В мобильных устройствах распознавание речи появилось в конце 90-х годов. Например, многие помнят, что допотопная ныне, но революционная в свое время Nokia 3310 почти не ошибалась, выискивая в телефонной книге абонента по приказу владельца. Однако, такое распознавание было весьма условным – произнесенные фразы телефон не расшифровывал, а сравнивал с заранее записанными в памяти. Сегодня же в смартфонах встречаются и программы полноценного распознавания, хотя и весьма упрощенные, предназначенные в основном для того же голосового набора.
Эффектный пример работы сервиса на примере типичной бытовой ситуации привел Андрей Дороничев, менеджер по мобильным продуктам Google:
- В беседе с другом я спросил у него - сколько сейчас стоит хороший Android-смартфон? Около 500 долларов, ответил мне он. А сколько это будет в рублях? Я произношу в свой телефон "пятьсот баксов в рублях" и мгновенно получаю результат поиска – 15 514 рублей! Сервис голосового поиска мгновенно сделал несколько вещей, а именно:
1. Распознал фразу.
2. Распознал жаргонное слово "бакс", как доллар.
3. Соотнес слова "бакс" и "рубли" и понял, что речь идет о переводе курсов денег.
4. Нашел актуальную информацию о курсе доллара к рублю и произвел пересчет!
Впрочем, на самом деле сервис голосового поиска выполнил лишь первый пункт списка – остальные три – штатные способности поиска Google, и результат запроса будет одинаковым – неважно, набран ли он на клавиатуре компьютера, или произнесен в микрофон телефона. Но это не умаляет достоинств сервиса – за выполнением этого пресловутого первого пункта стоит колоссальная работа множества программеров и лингвистов!
СПРАВКА F5
"Облачные вычисления" в смартфонах используются для решения самых необычных задач. Многие знают сервис Google под названием "Googles", который распознает по фото с мобильника географические объекты, после чего выдает всякие полезные вещи о них – от названия музея до телефона ресторана. По аналогии с этим приложением действует, к примеру, программа для помощи незрячим людям. Наведя камеру телефона на открытый холодильник или кухонную полку, инвалид слышит голосовые подсказки о ее содержимом. Это позволяет ему взять нужную банку или упаковку, даже не видя ее. Распознавание огромного количества изображений и самое главное, с высокой скоростью – непосильная задача даже для самых мощных смартфонов. Поэтому все увиденное своей камерой телефон отправляет на специальный сервер, который проводит распознание и мгновенно отсылает назад результат.
Но почему одновременно с запуском приложений голосового поиска для Android, iPhone и Nokia 60-й серии, проигнорирована платформа Windows Mobile? Об этом F5 спросил у Андрея Дороничева, менеджера по мобильным продуктам Google.
- Да, в России ОС Windows Mobile еще весьма популярна (в отличие от остального мира!), соглашается Андрей.
Но для Windows Mobile приложения голосового поиска нет. И ничего не могу сказать о перспективах – пока, наверное, ждать не стоит. Причину нельзя назвать однозначно, она комплексная. Тут и молодость и подразумеваемая под ней беспроблемность Android – операционной системы, лишенной груза багов более старых систем, и наличие большого разнообразия Windows-Mobile –устройств, под которые замучаешься делать твики, чтобы приложение корректно работало на каждом из девайсов, и многое другое...
Такие объяснения, честно говоря, не выглядят особенно убедительными. Да, "WinMo" в версии "6.5-с копейками", которая сегодня устанавливается на имеющиеся в продаже коммуникаторы, не столь молода и перспективна, как Android. Но Symbian S60 в этом смысле - фактически же самое, да и безупречной ее не назовешь, а ведь под S60 гугловцы все же сделали аппликейшн голосового поиска ...
Геморрой затачивания голосового поиска под множество отличающихся друг от друга "WinMo"-телефонов – тоже, ИМХО, проблема надуманная. Во всяком случае, "андроиды" разных марок так же не отличаются стопроцентной идентичностью в плане поддержки программ – достаточно почитать любой тематический форум, чтобы увидеть, что один и тот же софт с разным успехом работает на различных телефонах... Скорее всего, причина игнора "WinMo" - более глубокого, "политического" свойства. И это, несомненно, огорчает...
ГДЕ СКАЧАТЬ ПРИЛОЖЕНИЕ ДЛЯ ГОЛОСОВОГО ПОИСКА?
- Android
В версии 2.1 и выше – предустановлен. В более ранних – скачать в Android Market. - Symbian S60
Скачать на m.google.ru/search - iPhone
Скачать в AppStore
Источник: futurych.f5.ru
blog comments powered by Disqus


