Audiovisual speech recognition for training hearing impaired patients

Bożena Kostek; Piotr Dalka; Andrzej Czyżewski

doi:10.1142/9789812773197_0033

Praca przedstawia system rozpoznawania izolowanych głosek mowy wykorzystujący dane wizualne i akustyczne. Modele Active Shape Models zostały wykorzystane do wyznaczania parametrów wizualnych na podstawie analizy kształtu i ruchu ust w nagraniach wideo. Parametry akustyczne bazują na współczynnikach melcepstralnych. Sieć neuronowa została użyta do rozpoznawania wymawianych głosek na podstawie wektora cech zawierającego oba typy parametrów. Dodatkowo zbadano odporność systemu na zakłócenia w sygnale dźwiękowym.

Authors

prof. dr hab. inż. Bożena Kostek link open in new tab ,
mgr inż. Piotr Dalka link open in new tab ,
prof. dr hab. inż. Andrzej Czyżewski link open in new tab

Additional information

DOI: Digital Object Identifier link open in new tab 10.1142/9789812773197_0033
Category: Publikacja monograficzna
Type: rozdział, artykuł w książce - dziele zbiorowym /podręczniku w języku o zasięgu międzynarodowym
Language: angielski
Publication year: 2006

Source: MOSTWiedzy.pl - publication "Audiovisual speech recognition for training hearing impaired patients" link open in new tab

link open in new tab

Publications Repository - Gdańsk University of Technology

Treść strony