- Global Voices по-русски - https://ru.globalvoices.org -

Эти люди хотят, чтобы ваш телефон говорил с вами на языке суахили

Категории: Кения, гражданская журналистика, технологии, язык, Rising Voices
[1]

Фото сделано Eli Duke с Flickr (CC BY-SA 2.0)

[Все ссылки ведут на сайты на английском языке]

Имея, по подсчётам, около 100 миллионов носителей [2], суахили является вторым по распространенности языком на африканском континенте после арабского. Однако такие сервисы, как автоматическое распознавание речи (ASR) не являются коммерчески доступными на этом языке, лишая многих пользователей с ограниченными возможностями и безграмотных людей информации, которая очень необходима для них в повседневной жизни. Но в скором времени это может измениться — академические исследования и технологические стартапы сосредоточились на обеспечении локализованных технологий для говорящих на языке суахили.

Поиск в Интернете на простом мобильном телефоне

Одно из этих очень многообещающих нововведений скоро будет развернуто в Кении. Улиза [3] (что означает «спросить» на суахили) — это голосовой интерфейс, который позволяет пользователям получать доступ к информации из интернета с помощью базового мобильного телефона.

Всё, что необходимо пользователям — это позвонить и задать вопрос на суахили. В течение 15-90 минут «отвечающий агент» (реальный человек, работающий за кулисами) отвечает с помощью голосового ответа. На данный момент «толпа» из примерно 50 агентов обрабатывает запросы путем перезаписи голосовых записей, осуществляя онлайн поиск ответов на нескольких языках, а также перевод информации, и отправляя обратно запрашивающей стороне на языке суахили.

Во время эксперимента, проведенного в столице Кении — Найроби — и в Западной Кении, около 600 бета-пользователей задавали вопросы о своих местных представителях, просили помочь с домашними заданиями по языку суахили, а также просили предоставить медицинскую информацию, которая была бы слишком деликатна для ее предоставления лично.

Во время пилотного запуска проекта «Улиза» эти слова были включены в число наиболее задаваемых вопросов пользователями (переведенные с языка суахили на английский язык).

Улиза решит еще одну проблему для своих будущих пользователей: отсутствие доступа к информации, размещенной в Интернете. Для этой ситуации есть множество причин: слишком дорогие пакеты мобильных данных, расстояние до ближайшего интернет-кафе, незнание языков более широкого общения, осложненное нехваткой доступного контента на местных языках.

Не техническая проблема

Модель краудсорсинга Улизы, по общему признанию, является трудоемкой, но она имеет большое преимущество: благодаря тому, что обрабатывают транскрипцию и перевод люди, она временно обходит отсутствие больших наборов речевых данных, которые обычно ограничивают усилия ASR на африканских языках, одновременно собирая данные реальных носителей с различными акцентами и диалектами. Основатель Улизы Грант Бриджмен планирует использовать базу данных коротких записей и транскрипций для создания возможностей машинного обучения и полной автоматизированной системы в будущем. В этом выступлении в Университете Тафтса Бриджмен представил концепцию проекта:

Уже проведен большой объем исследований по созданию программного обеспечения автоматического распознавания речи для языка суахили и других широко распространенных африканских языков, однако требуется некоторое время для того, чтобы эта технология нашла свой путь в руки людей. В интервью GV Бриджмен объяснил:

The technology exists and all of this is already available for first world languages, now we need to find a commercial model to make it viable for low-resource languages.

Технология существует, и всё это уже доступно для языков первого мира, теперь нам нужно найти коммерческую модель, чтобы сделать ее жизнеспособной для языков с ограниченными ресурсами.

Компании, которые хотят создать горячую линию для сельской клиентской базы по сниженной цене, являются потенциальными клиентами на начальном этапе роста Улизы. В конечном итоге будет реализован полный сервис, позволяющий пользователям мобильных телефонов, не имеющим доступа в Интернет, найти ответы на свои вопросы и загрузить свой собственный голосовой контент. Стоимость для пользователя будет минимальной — близкой к цене СМС.

Модель Улизы могла бы быть жизнеспособной для других языков с достаточно большим количеством носителей. Но для подавляющего большинства из 2000 языков, на которых говорят на африканском континенте, это не так. Но решения могут исходить из исследовательского проекта [4], возглавляемого Прети Джйоти в Институте Бекмана, где группа исследователей использовала вероятностный метод для сбора транскрипций от не-носителей. После тонкой настройки вероятностная транскрипция может открыть возможность ASR для менее представленных языков, надеюсь, по разумной цене.