REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI

Szymon Zaporowski; Sebastian Cygert; Grzegorz Szwoch; Grazina Korvel; Andrzej Czyżewski

doi:10.32016/1.60.28

Praca dotyczy rejestracji i parametryzacji alofonów w języku angielskim z wykorzystaniem dwóch modalności. W badaniach dokonano rejestracji wypowiedzi w języku angielskim mówców, których znajomość tego języka odpowiada poziomowi rodowitego mówcy. W kolejnym etapie wyodrębnione zostały alofony z nagrań fonicznych i odpowiadające im sygnały wizyjne. W procesie tworzenia wektorów cech wykorzystano odrębne systemy parametryzacji, osobne dla każdej modalności. Do parametryzacji sygnału fonicznego użyto typowych deskryptorów stosowanych w obszarze rozpoznawania mowy i muzyki. W nagraniach z systemu przechwytywania ruchu zaproponowano własne rozwiązania. Do klasyfikacji alofonów wykorzystano sieci neuronowe oraz maszynę wektorów nośnych w podejściu jedno- i dwumodalnym. Stwierdzono, że skuteczność rozpoznawania wzrasta wraz z wykorzystaniem więcej niż jednej modalności.

Authors

Download

Additional information

DOI: Digital Object Identifier link open in new tab 10.32016/1.60.28
Category: Publikacja w czasopiśmie
Type: artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
Language: polski
Publication year: 2018

Source: MOSTWiedzy.pl - publication "REJESTRACJA, PARAMETRYZACJA I KLASYFIKACJA ALOFONÓW Z WYKORZYSTANIEM BIMODALNOŚCI" link open in new tab

link open in new tab

Publications Repository - Gdańsk University of Technology

Treść strony