Repozytorium publikacji - Politechnika Gdańska

Ustawienia strony

english
Repozytorium publikacji
Politechniki Gdańskiej

Treść strony

Interpretable Deep Learning Model for the Detection and Reconstruction of Dysarthric Speech

We present a novel deep learning model for the detection and reconstruction of dysarthric speech. We train the model with a multi-task learning technique to jointly solve dysarthria detection and speech reconstruction tasks. The model key feature is a low-dimensional latent space that is meant to encode the properties of dysarthric speech. It is commonly believed that neural networks are black boxes that solve problems but do not provide interpretable outputs. On the contrary, we show that this latent space successfully encodes interpretable characteristics of dysarthria, is effective at detecting dysarthria, and that manipulation of the latent space allows the model to reconstruct healthy speech from dysarthric speech. This work can help patients and speech pathologists to improve their understanding of the condition, lead to more accurate diagnoses and aid in reconstructing healthy speech for afflicted patients.

Autorzy

Informacje dodatkowe

DOI
Cyfrowy identyfikator dokumentu elektronicznego link otwiera się w nowej karcie 10.21437/interspeech.2019-1206
Kategoria
Aktywność konferencyjna
Typ
publikacja w wydawnictwie zbiorowym recenzowanym (także w materiałach konferencyjnych)
Język
angielski
Rok wydania
2019

Źródło danych: MOSTWiedzy.pl - publikacja "Interpretable Deep Learning Model for the Detection and Reconstruction of Dysarthric Speech" link otwiera się w nowej karcie

Portal MOST Wiedzy link otwiera się w nowej karcie