Repozytorium publikacji - Politechnika Gdańska

Ustawienia strony

english
Repozytorium publikacji
Politechniki Gdańskiej

Treść strony

The Impact of Foreign Accents on the Performance of Whisper Family Models Using Medical Speech in Polish

The article presents preliminary experiments investigating the impact of accent on the performance of the Whisper automatic speech recognition (ASR) system, specifically for the Polish language and medical data. The literature review revealed a scarcity of studies on the influence of accents on speech recognition systems in Polish, especially concerning medical terminology. The experiments involved voice cloning of selected individuals and adding prosodic contours with Russian and German accents, followed by transcription of these samples using all available models from the Whisper family and comparison with the original transcription. The results of these initial experiments suggest that the Whisper model struggles with foreign accents in the context of Polish language and medical terminology. This highlights the need for further research aimed at improving ASR systems for foreign accents and medical terminology.

Autorzy

Informacje dodatkowe

DOI
Cyfrowy identyfikator dokumentu elektronicznego link otwiera się w nowej karcie 10.62036/isd.2024.110
Kategoria
Aktywność konferencyjna
Typ
publikacja w wydawnictwie zbiorowym recenzowanym (także w materiałach konferencyjnych)
Język
angielski
Rok wydania
2024

Źródło danych: MOSTWiedzy.pl - publikacja "The Impact of Foreign Accents on the Performance of Whisper Family Models Using Medical Speech in Polish" link otwiera się w nowej karcie

Portal MOST Wiedzy link otwiera się w nowej karcie