Автор Тема: Разработана первая русскоязычная технология поиска "ключевых" слов  (Прочитано 1562 раз)

Оффлайн KeyMS

  • http://avangard-card.ru - Получи карту банка Авангард бесплатно !
  • Продвинутый
  • *****
  • Сообщений: 5056
  • Карма: +848/-11
  • https://medovsky.ru
    • Просмотр профиля
    • Отличный мёд с пасеки
Компанией «Центр Речевых Технологий» разработана технология поиска «ключевых» слов в фонограммах речи для русского языка – Voice Digger. Это первая в России коммерческая разработка в области audio data mining.

Voice Digger позволяет осуществлять автоматическое определение «ключевых» слов и словосочетаний в потоке слитной речи без предварительного прослушивания и, таким образом, становится хорошим помощником в работе с аудио архивами и мониторинге аудиоинформации. Voice Digger основан на непрерывном распознавании речи, реализуемом на акустических скрытых Марковских моделях (HMM).
Ключевые слова задаются в виде обычного набранного текста, по которому система строит НММ модель каждого слова. Кроме того в системе задается так называемая фоновая модель - модель общей речи. При построении моделей ключевых слов используется транскриптор русского языка и акустические модели фонов для русского языка. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания. Метод является достаточно быстрым и не зависит от словаря. Уровень ошибки составляет 8%.

По мнению специалистов, новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике.

Источник: www.speechpro.ru