Эти люди хотят, чтобы ваш телефон говорил с вами на языке суахили

Фото сделано Eli Duke с Flickr (CC BY-SA 2.0)

[Все ссылки ведут на сайты на английском языке]

Имея, по подсчётам, около 100 миллионов носителей, суахили является вторым по распространенности языком на африканском континенте после арабского. Однако такие сервисы, как автоматическое распознавание речи (ASR) не являются коммерчески доступными на этом языке, лишая многих пользователей с ограниченными возможностями и безграмотных людей информации, которая очень необходима для них в повседневной жизни. Но в скором времени это может измениться — академические исследования и технологические стартапы сосредоточились на обеспечении локализованных технологий для говорящих на языке суахили.

Поиск в Интернете на простом мобильном телефоне

Одно из этих очень многообещающих нововведений скоро будет развернуто в Кении. Улиза (что означает «спросить» на суахили) — это голосовой интерфейс, который позволяет пользователям получать доступ к информации из интернета с помощью базового мобильного телефона.

Всё, что необходимо пользователям — это позвонить и задать вопрос на суахили. В течение 15-90 минут «отвечающий агент» (реальный человек, работающий за кулисами) отвечает с помощью голосового ответа. На данный момент «толпа» из примерно 50 агентов обрабатывает запросы путем перезаписи голосовых записей, осуществляя онлайн поиск ответов на нескольких языках, а также перевод информации, и отправляя обратно запрашивающей стороне на языке суахили.

Во время эксперимента, проведенного в столице Кении — Найроби — и в Западной Кении, около 600 бета-пользователей задавали вопросы о своих местных представителях, просили помочь с домашними заданиями по языку суахили, а также просили предоставить медицинскую информацию, которая была бы слишком деликатна для ее предоставления лично.

Во время пилотного запуска проекта «Улиза» эти слова были включены в число наиболее задаваемых вопросов пользователями (переведенные с языка суахили на английский язык).

Улиза решит еще одну проблему для своих будущих пользователей: отсутствие доступа к информации, размещенной в Интернете. Для этой ситуации есть множество причин: слишком дорогие пакеты мобильных данных, расстояние до ближайшего интернет-кафе, незнание языков более широкого общения, осложненное нехваткой доступного контента на местных языках.

Не техническая проблема

Модель краудсорсинга Улизы, по общему признанию, является трудоемкой, но она имеет большое преимущество: благодаря тому, что обрабатывают транскрипцию и перевод люди, она временно обходит отсутствие больших наборов речевых данных, которые обычно ограничивают усилия ASR на африканских языках, одновременно собирая данные реальных носителей с различными акцентами и диалектами. Основатель Улизы Грант Бриджмен планирует использовать базу данных коротких записей и транскрипций для создания возможностей машинного обучения и полной автоматизированной системы в будущем. В этом выступлении в Университете Тафтса Бриджмен представил концепцию проекта:

Уже проведен большой объем исследований по созданию программного обеспечения автоматического распознавания речи для языка суахили и других широко распространенных африканских языков, однако требуется некоторое время для того, чтобы эта технология нашла свой путь в руки людей. В интервью GV Бриджмен объяснил:

The technology exists and all of this is already available for first world languages, now we need to find a commercial model to make it viable for low-resource languages.

Технология существует, и всё это уже доступно для языков первого мира, теперь нам нужно найти коммерческую модель, чтобы сделать ее жизнеспособной для языков с ограниченными ресурсами.

Компании, которые хотят создать горячую линию для сельской клиентской базы по сниженной цене, являются потенциальными клиентами на начальном этапе роста Улизы. В конечном итоге будет реализован полный сервис, позволяющий пользователям мобильных телефонов, не имеющим доступа в Интернет, найти ответы на свои вопросы и загрузить свой собственный голосовой контент. Стоимость для пользователя будет минимальной — близкой к цене СМС.

Модель Улизы могла бы быть жизнеспособной для других языков с достаточно большим количеством носителей. Но для подавляющего большинства из 2000 языков, на которых говорят на африканском континенте, это не так. Но решения могут исходить из исследовательского проекта, возглавляемого Прети Джйоти в Институте Бекмана, где группа исследователей использовала вероятностный метод для сбора транскрипций от не-носителей. После тонкой настройки вероятностная транскрипция может открыть возможность ASR для менее представленных языков, надеюсь, по разумной цене.

Начать обсуждение

Авторы, пожалуйста вход в систему »

Правила

  • Пожалуйста, относитесь к другим с уважением. Комментарии, содержащие ненависть, ругательства или оскорбления не будут опубликованы.