Наукова періодика України Вісник Вінницького політехнічного інституту


Ковтун В. В. 
Оцінювання основного тону у автоматизованій системі розпізнавання мовця критичного застосування / В. В. Ковтун // Вісник Вінницького політехнічного інституту. - 2018. - № 4. - С. 61-73. - Режим доступу: http://nbuv.gov.ua/UJRN/vvpi_2018_4_10
Запропоновано метод оцінювання трендів основного тону, який, на відміну від існуючих, використовує оптимізовану із застосуванням дерева переходів факторіальну приховану Марковську модель для формування трендів основного тону узагальнюючи при цьому інформацію від детекторів станів основного тону, на основі глибокої та рекурентної нейромереж, що дозволило спрогнозувати оцінки станів основного тону, використовуючи довготривалу інформацію з пакетів фреймів мовного сигналу, описати часову динаміку основного тону та зменшити вплив шумів у мовному сигналі на якість оцінок основного тону. Створено методи оцінювання станів основного тону на основі глибокої та рекурентної нейромереж та метод оцінювання трендів основного тону на основі факторіальної прихованої Марковської моделі (ФПММ). Проведено дослідження для оптимізації параметрів запропонованих методів для використання у складі автоматизованої системи розпізнавання мовця критичного застосування (АСРМКЗ). Зокрема, результати досліджень дозволяють рекомендувати нормовані за потужністю кепстральні ознаки як базові для оцінювання основного тону запропонованими методами, застосовувати в роботі методів пакети фреймів тривалістю 10 фреймів, будувати описані у методах нейромережі, використовуючи на прихованих шарах 1024 нейрони та використовувати 68 станів для опису основного тону. Результати проведених досліджень залежності якості розпізнавання мовців АСРМКЗ від рівня відношення сигнал/шум (ВСШ) у вхідному мовному матеріалі та оцінками основного тону, одержаними в результаті роботи створених методів, параметри яких оптимізовано з урахуванням результатів проведених досліджень, показали, що для всіх рівнів ВСШ найточніші оцінки основного тону надає ФПММ-метод, забезпечуючи імовірність правильного розпізнавання мовців АСРМКЗ на рівні 96 - 99 % для обраної тестувальної вибірки.
  Повний текст PDF - 566.723 Kb    Зміст випуску     Цитування публікації

Цитованість авторів публікації:
  • Ковтун В.

  • Бібліографічний опис для цитування:

    Ковтун В. В. Оцінювання основного тону у автоматизованій системі розпізнавання мовця критичного застосування / В. В. Ковтун // Вісник Вінницького політехнічного інституту. - 2018. - № 4. - С. 61-73. - Режим доступу: http://nbuv.gov.ua/UJRN/vvpi_2018_4_10.

    Додаткова інформація про автора(ів) публікації:
    (cписок формується автоматично, до списку можуть бути включені персоналії з подібними іменами або однофамільці)
  • Ковтун Віра Володимирівна (історичні науки)
  •   Якщо, ви не знайшли інформацію про автора(ів) публікації, маєте бажання виправити або відобразити більш докладну інформацію про науковців України запрошуємо заповнити "Анкету науковця"
     
    Відділ інформаційно-комунікаційних технологій
    Пам`ятка користувача

    Всі права захищені © Національна бібліотека України імені В. І. Вернадського