Форум.orn

HARD&SOFT => Программы => Тема начата: KeyMS от 16 Февраля 2008, 23:19:36

Название: Разработана первая русскоязычная технология поиска "ключевых" слов
Отправлено: KeyMS от 16 Февраля 2008, 23:19:36
Компанией «Центр Речевых Технологий» разработана технология поиска «ключевых» слов в фонограммах речи для русского языка – Voice Digger. Это первая в России коммерческая разработка в области audio data mining.

Voice Digger позволяет осуществлять автоматическое определение «ключевых» слов и словосочетаний в потоке слитной речи без предварительного прослушивания и, таким образом, становится хорошим помощником в работе с аудио архивами и мониторинге аудиоинформации. Voice Digger основан на непрерывном распознавании речи, реализуемом на акустических скрытых Марковских моделях (HMM).
Ключевые слова задаются в виде обычного набранного текста, по которому система строит НММ модель каждого слова. Кроме того в системе задается так называемая фоновая модель - модель общей речи. При построении моделей ключевых слов используется транскриптор русского языка и акустические модели фонов для русского языка. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания. Метод является достаточно быстрым и не зависит от словаря. Уровень ошибки составляет 8%.

По мнению специалистов, новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.

Источник: www.speechpro.ru