WWW.KNIGA.SELUK.RU

БЕСПЛАТНАЯ ЭЛЕКТРОННАЯ БИБЛИОТЕКА - Книги, пособия, учебники, издания, публикации

 

УДК 004.93

А.Л. Ронжин, А.А. Карпов, И.В. Ли

Санкт-Петербургский институт информатики и автоматизации РАН, Россия,

ronzhin@iias.spb.su, karpov@iias.spb.su, lee@iias.spb.su

Система автоматического распознавания

русской речи SIRIUS*

В статье представлена разработанная в группе речевой информатики СПИИРАН система распознавания

слитной русской речи SIRIUS. Особенностью данной системы является наличие в ней морфемного уровня

представления языка и речи, что позволяет значительно сократить размер лексического распознаваемого словаря и скорость обработки. Описан процесс внедрения системы распознавания русской речи в области инфотелекоммуникаций для голосового доступа к интернет-версии электронного каталога «Желтые cтраницы Санкт-Петербурга» с целью создания автоматизированного call-центра для ответов на звонки абонентов. В статье представляются результаты тестирования системы как при работе с речью, записанной в офисных условиях, так и в условиях телефонного разговора.

Введение Информационные технологии все больше и больше проникают в повседневную жизнь каждого человека. Технические устройства развиваются в сторону интеллектуализации и автоматизации предоставляемых ими сервисов и услуг.

Особенно активно развиваются системы искусственного интеллекта, связанные с распознаванием образов, анализом изображений и речи. В последнее время особое внимание как исследователей, так и конечных пользователей уделяется разработке и применению автоматизированных систем, построенных с использованием систем распознавания речи. Речевые технологии находят все большее распространение в робототехнике, системах управления оборудованием, средствах телекоммуникаций.

Такие приложения уже являются реальностью в странах США и Европы. В России сейчас также предпринимаются некоторые попытки разработать и внедрить подобные системы и сервисы. Основной проблемой здесь является трудность применения технологий распознавания речи для русского языка из-за сложного механизма словообразования. В отличие от, скажем, английского языка русский язык обладает гораздо большей вариативностью на уровне словоформ. В связи с чем резко возрастает размер распознаваемого словаря и падает точность. Попытки наложения синтаксических ограничений на распознаваемые фразы приводят к тому, что ошибки на уровне окончаний слов или приставок приводят к ошибке распознавания всей произнесенной фразы. Кроме того, естественная речь содержит множество неточностей и отклонений, которые не могут быть учтены заранее. Неудача существующих на рынке подходов к распознаванию и пониманию речи состоит в том, что они не обладают * Данные исследования проводятся при финансовой поддержке Правительства СанктПетербурга, Фонда содействия отечественной науке и Европейского Сообщества SIMILAR NoE FP6:





IST-2002-507609, а также проекта INTAS № 04-77-7404.

590 «Искусственный интеллект» 3’ Система автоматического распознавания русской речи SIRIUS 7Р достаточной робастностью алгоритмов распознавания и понимания речи к различным возможным искажениям сигнала на входе системы и собственным ошибкам обработки, а также их недостаточно высокой точности работы.

Для решения указанных проблем группой речевой информатики СПИИРАН был введен дополнительный уровень представления языка и речи – морфемный уровень и разработана оригинальная система распознавания русской речи SIRIUS (SPIIRAS Interface for Recognition and Integral Understanding of Speech) [1]. За счет разделения словоформ на морфемы словарь распознаваемых лексических единиц значительно сократился, так как в процессе словообразования часто используются одни и те же морфемы. На основе правил словообразования русского языка были разработаны базы данных различных типов морфем, а также методы автоматической обработки текстов. Разработанные базы данных морфем далее использовались для накопления статистики встречаемости морфем по текстовым корпусам, причем в ходе распознавания основное значение имеет степень согласованности корневых морфем. В результате такой обработки скорость распознавания и устойчивость к синтаксическим отклонениям в произнесенной фразе увеличились.

В процессе создания лексических баз данных использован базовый словарь Зализняка размером около 160 000 слов [2]. При распознавании слитной речи обеспечена дикторонезависимость по отношению к носителям русского языка, а также точность свыше 90 % на словаре около 2 000 слов конкретной предметной области. Кроме того, модель была опробована при распознавании речи через телефонный канал. Представлены предварительные результаты и методы, использованные для очистки речевого сигнала от шумов. Разработанные модули и базы данных собраны в единый аппаратно-программный комплекс для автоматического ввода и распознавания русской речи.

1 Особенности распознавания русской речи На сегодняшний день активнее всего ведутся исследования и разработки систем автоматического распознавания английской речи, поэтому далее приведем несколько отличий русского и английского языков, а также ряд проблем, возникающих при распознавании русской речи.

В русском языке по сравнению с английским более сложная структура словообразования (из-за того, что русский язык является синтетическим языком), в результате чего необходимо использовать гораздо больший распознаваемый словарь, что значительно уменьшает точность распознавания и скорость распознавания. В передовых системах распознавания речи для английского языка (от фирм Microsoft, Scansoft, IBM) используется словарь свыше 100 тыс. слов. Для русского языка за счет наличия приставок, суффиксов и окончаний этот словарь возрастает на порядок и более. Грамматический словарь А.А. Зализняка содержит около 160 тысяч наиболее употребительных слов русского языка, при помощи специальной системы обозначений он позволяет построить все словоформы для выбранного слова. При развороте всех словарных статей получается около 3,7 млн словоформ. Кроме того, большинство словоформ одного и того же слова отличаются только в окончаниях, которые произносятся обычно не так четко, как начала слов. А ошибки в окончаниях при распознавании слов приводят к тому, что происходит ошибка в распознавании всей фразы из-за несогласованности слов.





«Штучний інтелект» 3’ Порядок слов в предложении русского языка не задан жестко, а может варьироваться без потери смысла предложения, в английском же языке используются жесткие грамматические конструкции. Это затрудняет создание статистических моделей языков на основе биграмм или N-gram, а также грамматик для русского языка и понижает их эффективность.

Различен фонетический алфавит языков. В международном фонетическом алфавите SAMPA для русского языка принято 44 фонемы: 38 фонем согласных звуков и 6 фонем гласных звуков. В американском варианте английского языка фонетический алфавит SAMPA насчитывает 41 фонему: 24 согласных и 17 гласных (включая целый ряд дифтонгов). Очевидно, что распознавание согласных звуков сложнее, чем гласных, из-за того, что они менее стабильны, чем гласные, и имеют гораздо меньшую длительность.

В русском языке в среднем более длинные слова, чем в английском языке, что замедляет процесс распознавания, так как необходимо анализировать более длинные участки сигнала.

Сложность распознавания русской речи связана также с тем, что Россия является многонациональной страной и каждая нация владеет, помимо русского языка, еще и национальным. В результате русскоговорящее население обладает большой вариативностью национальных акцентов и стилей произношения, которые весьма сложно учесть при создании дикторонезависимых систем распознавания речи, поскольку необходимо создавать очень большие базы данных обучения акустических моделей.

Для создания эффективных систем распознавания для английского языка существуют многочисленные речевые базы данных (обычной речи, телефонной и т.д.), в том числе и свободно доступные. Для русского языка такие базы данных пока только начинают создаваться и, как правило, являются закрытыми для общего пользования.

В следующих разделах будет предложено решение проблем автоматического распознавания русской речи, учитывающее указанные трудности и специфику русского языка.

2 Обучение системы распознавания русской речи При создании дикторонезависимой системы распознавания речи возникает необходимость обучения акустико-лексических моделей этой системы.

На рис. 1 представлен процесс создания баз данных и словарей, необходимых для обучения дикторонезависимой системы распознавания речи. При распознавании речи используется словарь распознаваемых транскрибированных лексических единиц – слов или морфем (как в системе SIRIUS), поэтому при обучении системы распознавания речи и создании акустико-лексических баз данных необходимо использовать модули транскрибирования и морфемной сегментации.

Модуль транскрибирования осуществляет преобразование текстов предметной области в фонетическую транскрипцию. На вход модуля поступают: набор предложений, составляющих тексты; словарь слов из этих предложений, разбитый на морфемные единицы; словарь словоформ, полученных из базовых форм слов русского языка с отметкой ударного слога (слогов), используемый фонетический алфавит и фонетические правила. Результатом работы модуля транскрибирования является транскрибированный словарь словоформ предметной области, разбитый на морфемы.

Система автоматического распознавания русской речи SIRIUS Рисунок 1 – Базы данных модели распознавания русской речи В качестве фонетического алфавита мы использовали набор, представленный в табл. 1. В нашем варианте используются 48 фонем: 12 – для гласных звуков (с учетом ударных вариантов) и 36 – для согласных (с учетом твердости и мягкости звуков).

Таблица 1 – Перечень фонем для распознавания русской речи «Штучний інтелект» 3’ Необходимой частью автоматических процедур словообразования и морфемной сегментации являются базы данных различных типов морфем, поэтому достаточно большая часть времени была уделена их созданию.

Построение базы данных морфем было осуществлено на основе печатных изданий. Большая часть корневых морфем (около 4 000) была взята из словаря морфем русского языка Кузнецовой [3], а различные фиксальные морфемы и флексии взяты из словаря «Русская грамматика» [4]. Кроме того, далее при создании целого ряда приложений словарь морфем постоянно пополнялся и сейчас составляет около 5 000 морфем.

На основе разработанных лексических баз данных можно строить любые приложения, лексика которых покрывается данным словарем. Поэтому разработанные в ходе исследования базы данных можно разбить на две группы: (1) словари и правила русского языка и (2) словарь, формируемый для конкретной предметной области (ПО).

В ходе подготовки конкретного приложения также возможна модификация, дополнение основных словарей. Построение баз данных (в том числе, словаря морфем) конкретной предметной области начинается с анализа фраз ПО, формируется словарь ПО, далее производится разбиение слов на морфемы, при этом если находятся новые морфемы, то они добавляются в исходный словарь морфем.

Разбиение слова на морфемы осуществляется путем подбора различных типов морфем с учетом правил следования морфем в одном слове. В табл. 2 возможные пары типов морфем отмечены знаком «+». При получении недопустимой пары «—»

данная гипотеза разбиения слова на морфемы отбрасывается и поиск продолжается дальше, пока не обнаруживается конец слова «STOP».

Разработанные базы данных морфем использовались для создания морфемной модели языка, строящейся на основе статистики встречаемости различных пар морфем.

Для первичной оценки работоспособности модуля создания модели языка были использованы доступные в Интернете текстовые корпуса. Из них был создан текст общим объемом около 50 Мб, который потом был предварительно обработан и все слова в нем были разбиты на морфемы. При этом сохранялась разметка на предложения и слова, а морфемы помечались, к какому типу они принадлежат. В результате анализа текста был получен словарь морфем размером около 5 000 морфем, разбитых на 5 типов, и получены вероятности встречаемости всех пар морфем.

Акустическое моделирование в нашей системе основано на Скрытых Марковских Моделях (СММ) [5]. Марковские модели довольно содержательны по своей математической структуре, поэтому они стали теоретическим фундаментом для различных областей исследований, а не только языка и речи. СММ-модель речевого сигнала позволяет решать не только задачи распознавания речи, но также Система автоматического распознавания русской речи SIRIUS улучшать качество сигнала, загрязненного шумами и искажениями, моделировать источник речевого сигнала, оптимизировать структуру диалога и др.

Таблица 2 – Таблица согласования типов морфем в слове Тип текущей В СММ суть распознавания сводится к оценке правдоподобия принадлежности входной последовательности (наблюдаемой) к данной гипотетической модели.

Проблема обучения акустических моделей очень важна для большинства приложений, так как именно во время обучения происходит, в соответствии с выбранным критерием оптимальности, подстройка значений параметров модели по данным наблюдений, в результате чего создается модель, наилучшим образом соответствующая реальному явлению. Каждая базовая распознаваемая единица (фонема, аллофон или трифон) представляется некоторым типом скрытой марковской модели, настройка параметров которой осуществляется по обучающему множеству речевых данных. Необходимо учитывать, что обучающее множество акустических данных для СММ должно быть достаточно велико, чтобы учитывать возможный спектр пользователей системы. В качестве акустических моделей мы использовали многокомпонентные непрерывные СММ с Гауссовской функцией распределения вероятностей появления векторов. Для параметризации сигнала использовались mel-частотные кепстральные коэффициенты с их первой и второй производной. Для выделения полезного речевого участка из шума нами был разработан и применен метод, основанный на вычислении спектральной энтропии сигнала [6]. Для определения границ речи используется критерий отличия значений энтропии для речевых сегментов и для фонового шума.

Фонемы использовались в виде трифонов (фонем в определенном фонетическом контексте). СММ трифонов имеют 3 значащих состояния (и «пустых» состояния, предназначенных для объединения моделей трифонов в модели морфем). Процесс обучения СММ осуществлялся путем последовательного выполнения следующих процедур:

– инициализация СММ фонем;

– обучение СММ фонем на обучающих речевых БД (алгоритм Витерби);

– переход от моделей фонем к моделям трифонов и их инициализация;

– обучение СММ трифонов на обучающих речевых БД (алгоритм Витерби);

– объединение похожих моделей трифонов, имеющих небольшое количество обучающих данных;

– последовательное увеличение числа компонент гауссовых смесей моделей с одновременным обучением на речевых БД.

«Штучний інтелект» 3’ Для отработки методов автоматического обучения необходимо использование речевых баз данных, содержащих акустические файлы, а также их фонетические транскрипции, разметку акустического сигнала по фонемам, морфемам, словам и фразам.

Для обучения СММ были заранее подготовлены обучающие тексты (отдельные предложения предметной области). На основе полученного материала была произведена вышеописанная процедура обучения акустических моделей (СММ трифонов).

Таким образом, описанный процесс формирования лексических баз данных для конкретной предметной области и обучение акустических моделей позволяет далее строить различные приложения, использующие распознавание речи. Разработанные методы и модули для распознавания русской речи, а также процесс обработки речевого сигнала подробно описаны в следующем разделе.

3 Механизм распознавания русской слитной речи Подготовленные базы данных конкретной предметной области, а именно:

транскрибированный словарь морфем ПО, морфемная модель языка ПО, список фонем ПО и набор акустических моделей фонем ПО далее используются в ходе распознавания речи. Однако если при подготовке баз данных мы анализировали фразы, разбивая их на фонемы, то теперь будет осуществляться обратный процесс:

из наиболее вероятных цепочек фонем последовательно синтезируются морфемы, слова и фразы (рис. 2).

Речевой сигнал, поступающий с микрофона, в первую очередь проходит этап параметрического представления, где отрезаются начальные и конечные паузы в сигнале, а оставшийся участок кодируется в последовательность векторов признаков, которая уже следует в модуль распознавания фонем. При распознавании фонем (которые используются в форме трифонов) и формировании морфем используются методы Cкрытого Марковского Моделирования и смесей Гауссовских распределений. В отличие от существующих аналогов, в нашей модели вместо слов используются морфемы. За счет этого на этапе распознавания лексических единиц было получено существенное увеличение в скорости. При этом по сравнению с распознаванием целых слов точность распознавания морфем несколько снизилась, но за счет последующих уровней обработки точность распознавания фраз практически не изменилась.

После распознавания фонем и подбора наиболее вероятных цепочек морфем получившийся набор гипотез далее используется для формирования цепочек слов.

Синтез слов из различных типов морфем осуществляется по схеме, представленной на рис. 3.

В данной модели заданы начальное и конечное состояния, а в остальных узлах присутствуют все возможные типы морфем. Дугами обозначены возможные переходы. В будущем, возможно, эта модель будет вероятностной, а пока максимальное количество переходов из состояния в состояние заданы жестко. На этом этапе обработки на основе каждой поступившей гипотезы фразы, представленной в виде последовательности морфем, формируется еще несколько гипотез, представленных уже последовательностью гипотез слов.

Система автоматического распознавания русской речи SIRIUS Последним этапом обработки является синтез фразы. Здесь за счет семантикосинтаксического анализа производится оценка поступающих гипотез и по интегральному критерию выбирается наилучшая. Данный модуль основан на ранее разработанной в группе речевой информатики СПИИРАН модели интегрального понимания речи и пока не подвергся особым изменениям [7].

Таким образом, в результате исследований созданы базы данных различных типов морфем русского языка, программные модули для автоматизации процессов словообразования и морфологического разбора, программный модуль для накопления статистики встречаемости морфем по текстовому материалу, а также другие программные средства, необходимые для создания системы распознавания русской речи с большим словарем [8].

«Штучний інтелект» 3’ 4 Применение системы SIRIUS Для отладки и тестирования система распознавания русской речи была внедрена в электронный каталог «Желтые страницы Санкт-Петербурга», который доступен по адресу www.yell.ru, с целью создания единой автоматизированной справочной системы для поиска адресов и телефонов организаций, необходимых пользователю, при помощи обычного телефона.

Создание автоматизированной справочной системы с голосовым доступом к ресурсам электронного каталога посредством телефона (автоматизированный call-центр) позволит использовать для ответов на звонки абонентов не операторовлюдей, а систему автоматизированного распознавания речи с генерацией речевых ответов.

Размер словаря в данной задаче составил 1 850 слов, а при разбиении на морфемы размер морфемного словаря сократился до 1 360. Столь незначительное сокращение связано со спецификой задачи. Во-первых, такие части речи, как глагол, причастие, местоимение, имеющие особенно сложную структуру словообразования, употреблялись достаточно редко. Во-вторых, практически все существительные и прилагательные употреблялись только в именительном падеже во множественном числе (как это сделано в самом электронном каталоге). В то же время применение морфемного анализа при разборе произведения М.А. Булгакова «Мастер и Маргарита» дало уменьшение словаря почти в 8 раз (словарь слов – 22 984, словарь морфем – 2 920). Поэтому при создании стенографической системы реального времени с большим или средним словарем введение морфемного уровня будет иметь решающую роль в плане точности и скорости распознавания.

Для тестирования было предложено 635 фраз, записанных в офисных условиях.

В эксперименте участвовало 5 дикторов. Записанные файлы были пропущены через модель целословного распознавания, а затем через морфемно-ориентированную модель распознавания с последующим словообразованием. Результаты экспериментов представлены в табл. 3. По сравнению с первой моделью, точность распознавания морфем несколько снизилась, но за счет последующих уровней обработки точность распознавания фраз практически не изменилась.

Также был проведен тест, направленный на сравнение скорости работы распознавателя, основанного на морфемном распознавании и целословного распознавателя. Результаты приведены в табл. 4. Общее количество тестовых фраз, содержащихся в тестовой базе данных составило 635 (состоящих из 2 574 слов). Из таблицы видно, что при использовании разработанной системы скорость возросла более чем в 1,7 раза, что при незначительном падении точности позволяет говорить о создании перспективной системы распознавания речи для больших словарей.

Таким образом, разработанный модуль распознавания слитной русской речи показал достаточно высокую точность и дикторонезависимость к носителям русского языка. Следующим этапом в разработке системы голосового доступа к электронному каталогу будет исследование диалогового режима с пользователем, а также настройка системы распознавания речи к условиям работы в телефонных линиях, создание речевых баз данных, записанных в процессе диалога пользователя с системой через телефонный канал.

Система автоматического распознавания русской речи SIRIUS Таблица 3 – Сравнение моделей распознавания по точности Целословное распознавание тор распознавания распознавания распознавания распознавания Среднее Таблица 4 – Сравнение моделей распознавания по скорости обработки Время, затраченное на тестовый набор Среднее время на одну Среднее время на одно Среднее время на одну 5 Распознавание речи через телефонный канал При внедрении системы распознавания речи для задачи распознавания телефонной речи возникает проблема ухудшения качества работы системы, связанная с различными характеристиками телефонных линий и телефонных аппаратов. Во-первых, полоса пропускания аналоговой телефонной линии ограничена полосой 0 – 4 000 Гц.

Чтобы уменьшить влияние шума, вносимого каналом передачи информации, были использованы два метода очистки сигнала: полосовой фильтр (для отсекания некоторых низкочастотных шумов) и метод вычитания кепстрального среднего (Cepstral Mean Subtraction).

В настоящее время мы имеем результаты первых экспериментов по распознаванию телефонной русской речи. В качестве аппаратного обеспечения для соединения персонального компьютера с телефонной сетью общего пользования мы использовали внутренний голосовой факс-модем 3COM US Robotics и набор функций Telephone API для работы с телефонным устройством. Это наиболее простая версия соединения, и далее планируется использовать для соединения с «Штучний інтелект» 3’ телефонной линией многоканальные платы Intel Dialogic для аналоговых телефонных линий.

Далее представлены результаты экспериментов по использованию CMS и полосового фильтра для распознавания телефонной речи. В ходе наших экспериментов наилучшие показатели продемонстрировал полосовой фильтр от до 4 000 Гц. Рис. 4 показывает результаты по распознаванию речи в трех аналоговых телефонных линиях с различными техническими характеристиками (три столбца на диаграмме).

при использовании различных методов фильтрации Эта прикладная задача была связана с распознаванием произносимых через телефон русских цифр от 0 до 1000. Очевидно, что лучшие результаты показаны при использовании обоих методов фильтрации.

Таким образом, для решения задачи устойчивого распознавания речи в условиях телефонного разговора необходимо применение эффективных средств цифровой фильтрации и очистки сигнала от фонового шума. Для обучения и дальнейшего тестирования дикторонезависимой модели распознавания будет собрана база данных телефонной русской речи, созданная при использовании аналоговых телефонных линий.

Заключение Исследование проблем автоматического понимания/распознавания речи является важным фундаментальным направлением. Эта проблема сейчас сдерживает развитие всевозможных систем взаимодействия человека с машиной. Представленная модель голосового интерфейса в первую очередь направлена на учет особенностей русской речи. Нами был разработан и опробован новый морфемный метод представления языка и речи. Он показал высокое качество и устойчивость работы на словаре до 2 000 слов конкретной предметной области. Разработаны базы данных различных типов морфем и получена статистика встречаемости пар морфем по текстовым корпусам. В результате такой обработки обеспечивается инвариантность к грамматическим отклонениям, а также увеличивается скорость распознавания русской речи и других языков со сложным механизмом словообразования (в частности, славянских языков).

Система автоматического распознавания русской речи SIRIUS Последующие работы направлены на увеличение размера распознаваемого словаря, а также настройку системы распознавания русской речи SIRIUS к работе с телефонным каналом. При внедрении системы распознавания речи в телекоммуникационные приложения будут учтены проблемы, связанные со спецификой телефонных линий и различиями характеристик телефонных аппаратов. Накопленные речевые и лексические базы данных будут использованы для дальнейшего изучения механизма понимания речи и создания эффективных средств человекомашинного взаимодействия.

Литература 1. Ronzhin A.L., Karpov A.A. Implementation of morphemic analysis for Russian speech recognition / Proc. of 9th International Conf. SPECOM'2004. – Russia. – St. Petersburg, Publishing house «Anatolya». – 2004. – Р. 291-296.

2. Грамматический словарь русского языка / Сост. А.А. Зализняк. – М., 1977.

3. Словарь морфем русского языка / Сост. А.И. Кузнецова, Т.Ф. Ефремова. – М.: Рус. яз., 1986. – 1136 с.

4. Русская грамматика / АН СССР. Ин-т рус. яз. – М.: Наука, 1980.

5. Young S., et al. The HTK Book (v3.0). – Cambridge Univ. Engineering Department. – 2000.

6. Карпов А.А. Робастный метод определения границ речи на основе спектральной энтропии / Искусственный интеллект. – 2004. – № 4. – С. 607-613.

7. Методы понимания речи и текста / Ю.А. Косарев, И.В. Ли, А.Л. Ронжин, J. Savage / Под ред.

Р.М. Юсупова // Труды СПИИРАН. – Т. 2, вып. 1. – СПб.: «Анатолия», 2002. – С. 157-195.

8. Ronzhin A.L., Karpov A.A. Large Vocabulary Automatic Speech Recognition for Russian Language / Proc.

of Second Baltic Conf. on Human Language Technologies. – Tallinn (Estonia). – 2005. – Р. 329-334.

А.Л. Ронжин, О.А. Карпов, І.В. Лі Система автоматичного розпізнавання російського мовлення SIRIUS У статті представлена розроблена в групі мовленнєвої інформатики СПІІРАН система розпізнавання стягненого російського мовлення SIRIUS. Особливістю даної системи є наявність у ній морфемного рівня представлення мови і мовлення, що дозволяє значно скоротити розмір лексичного розпізнаваного словника і швидкість обробки. Описано процес упровадження системи розпізнавання російського мовлення в галузі інфотелекомунікацій для голосового доступу до інтернет-версії електронного каталогу «Жовті сторінки Санкт-Петербурга» з метою створення автоматизованого callцентра для відповідей на дзвінки абонентів. У статті представлено результати тестування системи як при роботі з мовленням, записаним в офісних умовах, так і в умовах телефонної розмови.

O.L. Ronzhin, A.A. Karpov, I.V. Lee Automatic System for Russian Speech Recognition SIRIUS In the paper the developed in Speech Informatics Group of SPIIRAS speech recognition system SIRIUS is presented. The peculiarity of this system is presence in this system the morphemic level of speech and language representation, that allows essential reducing of the size of lexical vocabulary and speech of processing. The process of introduction of ASR into infotelecommunications area for voice access to electronic catalogue «Yellow Pages of St. Petersburg», aimed for creation of automatic call-center for answering on users’ calls, is presented. In the paper the results of testing the system for work with clear speech and telephone speech is presented.

«Штучний інтелект» 3’

 
Похожие работы:

«Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования ПОВОЛЖСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТЕЛЕКОММУНИКАЦИЙ И ИНФОРМАТИКИ РУКОВОДЯЩИЙ РД ПГУТИ ДОКУМЕНТ 2.64.7-2013 Система управления качеством образования ПОРЯДОК ПЕРЕВОДА, ОТЧИСЛЕНИЯ И ВОССТАНОВЛЕНИЯ СТУДЕНТОВ В ПГУТИ Положение Самара 2013 РД ПГУТИ 2.64.7 – 2013 ПОРЯДОК ПЕРЕВОДА, ОТЧИСЛЕНИЯ И ВОССТАНОВЛЕНИЯ СТУДЕНТОВ В ПГУТИ Положение Предисловие 1 РАЗРАБОТАН Отделом качества образования ПГУТИ...»

«Стр 1 из 198 7 апреля 2013 г. Форма 4 заполняется на каждую образовательную программу Сведения об обеспеченности образовательного процесса учебной литературой по блоку общепрофессиональных и специальных дисциплин Иркутский государственный технический университет 120101 Прикладная геодезия Наименование дисциплин, входящих в Количество заявленную образовательную программу обучающихся, Автор, название, место издания, издательство, год издания учебной литературы, № п/п Количество (семестр, в...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФБГОУ ВПО ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ОСНОВНАЯ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ Направление 230400.68Информационные системы и технологии Наименование программ подготовки: Анализ и синтез информационных систем. Биоинформатика. Технологическое моделирование деталей и машин с 3D допусками в САПР нового поколения. Наименование степени / квалификации магистр Форма обучения очная Иркутск 2011 г. 1 СОДЕРЖАНИЕ Стр....»

«РЕЕСТР ВЕДУЩИХ НАУЧНЫХ И НАУЧНО-ПЕДАГОГИЧЕСКИХ ШКОЛ САНКТ-ПЕТЕРБУРГА Руководители ведущих научных и научно-педагогических школ Санкт-Петербурга № Руководитель НПШ Научная область деятельности НПШ Вуз (научная организация) пп Российский научно-исследовательский Абдулкадыров Кудрат Гематология, онкогематология институт гематологии и трансфузиологии 1 Мугутдинович ФМБА Айламазян Эдуард Иммунология репродукции, Научно-исследовательский институт 2 Карпович акушерство и гинекология акушерства и...»

«Научное обоснование развития сети особо охраняемых природных территорий в Республике Карелия Карельский научный центр Российской академии наук Научное обоснование развития сети особо охраняемых природных территорий в Республике Карелия Петрозаводск 2009 УДК 502.172 (470.22) ББК 20.18 (2Рос. Кар.) Н 34 Научное обоснование развития сети особо охраняемых природных территорий в Республике Карелия. Петрозаводск: Карельский научный центр РАН, 2009. 112 с.: ил. 14, табл. 6. Библиограф. 96 назв. ISBN...»

«ВЕСТНИК ТОМСКОГО ГОСУДАРСТВЕННОГО УНИВЕРСИТЕТА 2008 Филология № 2(3) УДК 811.161.1 О.И. Блинова СЛОВАРЬ ФИТОНИМОВ СРЕДНЕГО ПРИОБЬЯ КАК ИСТОЧНИК ДИАЛЕКТНОЙ МОТИВОЛОГИИ* Статья посвящена источниковедческому исследованию возможностей использования Словаря фитонимов Среднего Приобья для нужд диалектной мотивологии. Рассматриваются информативные возможности словаря для решения задач описательного, функционального и лексикографического аспектов мотивологии. Источниковедческий аспект той или иной...»

«ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ ВЫСШАЯ ШКОЛА ЭКОНОМИКИ Отделение Прикладной математики и информатики факультета Бизнес-информатики УТВЕРЖДЕНО на заседании Ученого совета факультета/филиала председатель Ученого совета _ И.О.Фамилия _ 2013 г. протокол № ОТЧЕТ по результатам самообследования отдельной профессиональной образовательной программы высшего профессионального образования...»

«Тема 1. Наука и научное мировоззрение. (2 часа лекций, 4 часа практических занятий) План 1 Философия естественных, гуманитарных и технических наук как учебная дисциплина. 1.1 Цель и задачи, структура и методы, 1.2 Значение курса Философия естественных, гуманитарных и технических наук для качества подготовки магистранта 2 Понятие науки и научного мировоззрения. 2.1 Критерии научности. 2.2 Научная картина мира. 3 Основания и критерии классификации современных наук. 3.1 История классификаций наук...»

«Орловская областная публичная библиотека им. И.А. Бунина Всероссийский библиотечный научно-методический центр экологической культуры на базе РГЮБ Экология Культура Общество Материалы Пятой Всероссийской школы – семинара Библиотека как центр экологической информации и культуры 10 - 21 ноября 2003 г. г. Орел ОРЕЛ 2004 Повышение квалификации библиотечных работников в области экологопросветительской деятельности – одно из важнейших условий успешной деятельности библиотек. Уже несколько лет...»

«Осин А.В. Предпосылки концепции образовательных электронных изданий. Эволюция модели образования В настоящее время информатизация сферы образования вступает на качественно новый уровень: решается задача массового использования компьютерных технологий в общем и профессиональном образовании. Рассматривается проблема создания единой для всех образовательных учреждений информационной среды. По существу это означает, что время пилотных проектов, разных подходов и диаметральных мнений, исходящих из...»

«Дайджест публикаций на сайтах органов государственного управления в области информатизации стран СНГ Период формирования отчета: 01.04.2014 – 30.04.2014 Содержание Республика Беларусь 1. 1.1. Министр связи и информатизации принял участие в заседании Совета Палаты представителей Национального собрания Республики Беларусь. Дата новости: 10.04.2014. 1.2. Форум ТИБО-2014 открыт приветственным словом Премьер-министра Республики Беларусь Мясниковича М.В. Дата новости: 21.04.2014. 1.3. Форум ТИБО-2014...»

«ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ НАЗЕМНО-КОСМИЧЕСКОГО МОНИТОРИНГА СЛОЖНЫХ ОБЪЕКТОВ: СОСТОЯНИЕ И ПЕРСПЕКТИВЫ РАЗВИТИЯ О. В. Майданович Военно-космическая академия им. А.Ф. Можайского, С.-Петербург E-mail: sid.sn@yandex.ru М. Ю. Охтилев ЗАО СКБ ОРИОН, С.-Петербург E-mail: oxt@mail.ru В. А. Зеленцов, Б. В. Соколов, Р. М. Юсупов Санкт-Петербургский институт информатики и автоматизации РАН E-mail: sokol@iias.spb.su Ключевые слова: наземно-космический мониторинг, интеллектуальная...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Филиал федерального государственного бюджетного образовательного учреждения высшего профессионального образования Кемеровский государственный университет в г. Анжеро-Судженске 1 марта 2013 г. РАБОЧАЯ ПРОГРАММА по дисциплине Безопасность жизнедеятельности (ЕН.Р.1) для специальности 080801.65 Прикладная информатика в экономике факультет информатики, экономики и математики курс: 1 семестр: 1 зачет: 1 семестр лекции: 18 часов практические...»

«В. И. Донской Алгоритмические модели обучения классификации: обоснование, сравнение, выбор Симферополь ДИАЙПИ 2014 УДК 519.7 ББК 22.12, 32.81 Д676 Донской В. И. Д676 Алгоритмические модели обучения классификации: обоснование, сравнение, выбор. – Симферополь: ДИАЙПИ, 2014. – 228 с. ISBN 978–966–491–534–9 В книге рассматриваются теоретические аспекты машинного обучения классификации. В центре изложения – обучаемость как способность применяемых алгоритмов обеспечивать эмпирическое обобщение. С...»

«МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ, МЕХАНИКИ И ОПТИКИ Факультет Информационных технологий и программирования Направление Прикладная математика и информатика Специализация : Математическое и программное обеспечение вычислительных машин Академическая степень магистр математики Кафедра Компьютерных технологий Группа 6538 МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ на тему Автоматный подход к реализации элементов графического...»

«RMC-M20 Уважаемый покупатель! Благодарим вас за то, что вы отдали предпочтение бытовой технике REDMOND. REDMOND — это качество, надежность и неизменно внимательное отношение к потребностям наших клиентов. Надеемся, что вам понравится продукция нашей компании, и вы также будете выбирать наши изделия в будущем. Мультиварка REDMOND RMC-M20 — современный многофункциональный прибор для приготовления пищи, в котором компактность, экономичность, простота и удобство использования гармонично сочетаются...»

«ПРАВИТЕЛЬСТВО МОСКВЫ КОМИТЕТ ПО АРХИТЕКТУРЕ И ГРАДОСТРОИТЕЛЬСТВУ УКАЗАНИЕ от 20 февраля 1998 г. N 7 ОБ УТВЕРЖДЕНИИ ПОСОБИЯ К МГСН 2.02-97 ПРОЕКТИРОВАНИЕ ПРОТИВОРАДОНОВОЙ ЗАЩИТЫ ЖИЛЫХ И ОБЩЕСТВЕННЫХ ЗДАНИЙ 1. Утвердить и ввести в действие для использования проектными организациями, осуществляющими проектирование жилых и общественных зданий для строительства в г. Москве и лесопарковом защитном поясе, разработанное НИИ строительной физики РААСН по заказу Москомархитектуры пособие к МГСН 2.02-97...»

«взаимодействующие поеледрвателш процессы Prentice-Hall InfernaHoB^il Series in Compuler Science Coitimtihicating Sequential Processes C. A. R. Hoare Professor of Computation Oxford University Prentice-Hall Englewood Cliffs, New Jersey London Mexico New Delhi Rio de Janeiro Singapore Sydney Tokyo Toronto Wellington Ч-Хоар Взаимодействующие последовательные процессы Перевод с английского А. А. Бульонковой под редакцией А. П. Ершова Москва Мир 1989 Б Б К 22.18 Х68 УДК 681.3 Хоар Ч. 'Х68...»

«Министерство образования и науки Российской Федерации ГОУ ВПО ИРКУТСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ Кибернетический Факультет Информатики Кафедра СОГЛАСОВАНО УТВЕРЖДАЮ Зам. директора по научной работе Проректор по учебной работе ИДСТУ СО РАН, к.т.н. _Н.А. Буглов _ Н.Н. Максимкин 20 _ г. _20 _ г. ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА ДИСЦИПЛИНЫ (рабочая учебная программа дисциплины) 150700 Машиностроение Направление подготовки: Оборудование и технология сварочного...»

«1. Реут Д.В. Кентавр в интерьере. Кентавр. Методологический и игротехнический альманах, М.: 1991, N 1, с. 2 2. Реут Д.В. К микроанализу мегамашин. Кентавр, 1993, N 2, с. 47-51, 009EUT.ZIP from www.circle.ru 3. Реут Д.В. Ad marginem metodologia. Кентавр, 1995, N 2, с. 41-50. 4. Реут Д.В. Буриданово человечество. Международный конгресс Фундаментальные основы экологии и духовного здоровья человека. 27 сентября – 4 октября 1995 г. Алушта. Крым. Украина. Тезисы докладов. Часть 2, М.: 1996, с. 21 5....»






 
© 2014 www.kniga.seluk.ru - «Бесплатная электронная библиотека - Книги, пособия, учебники, издания, публикации»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.