Spatial filtration of sound is introduced to enhance speech recognition accuracy in noisy conditions. An acoustic vector sensor (AVS) is employed. The signals from the AVS probe are processed in order to attenuate the surrounding noise. As a result the signal to noise ratio is increased. An experiment is featured in which speech signals are disturbed by babble noise. The signals before and after spatial filtration are processed by an automatic speech recognition (ASR) engine. It is shown that employing spatial filtration of signals from the AVS probe leads to a significant reduction in word error rate (WER) for a dictionary of 184 words.
Autorzy
- mgr inż. Kuba Łopatka link otwiera się w nowej karcie ,
- dr hab. inż. Józef Kotus link otwiera się w nowej karcie ,
- mgr inż. Piotr Bratoszewski link otwiera się w nowej karcie ,
- mgr inż. Paweł Spaleniak link otwiera się w nowej karcie ,
- mgr inż. Marcin Szykulski link otwiera się w nowej karcie ,
- prof. dr hab. inż. Andrzej Czyżewski link otwiera się w nowej karcie
Informacje dodatkowe
- DOI
- Cyfrowy identyfikator dokumentu elektronicznego link otwiera się w nowej karcie 10.1109/hsi.2015.7170647
- Kategoria
- Aktywność konferencyjna
- Typ
- materiały konferencyjne indeksowane w Web of Science
- Język
- angielski
- Rok wydania
- 2015