W referacie zaprezentowano audiowizualny korpus mowy zawierający 31 godzin nagrań mowy w języku angielskim. Korpus dedykowany jest do celów automatycznego audiowizualnego rozpoznawania mowy. Korpus zawiera nagrania wideo pochodzące z szybkoklatkowej kamery stereowizyjnej oraz dźwięk zarejestrowany przez matrycę mikrofonową i mikrofon komputera przenośnego. Dzięki uwzględnieniu nagrań zarejestrowanych w warunkach szumowych korpus może być wykorzystany do badania wpływu zakłóceń na skuteczność rozpoznawania mowy.
Autorzy
- mgr inż. Marcin Szykulski link otwiera się w nowej karcie ,
- mgr inż. Piotr Bratoszewski link otwiera się w nowej karcie ,
- dr hab. inż. Józef Kotus link otwiera się w nowej karcie ,
- prof. dr hab. inż. Andrzej Czyżewski link otwiera się w nowej karcie ,
- prof. dr hab. inż. Bożena Kostek link otwiera się w nowej karcie
Informacje dodatkowe
- DOI
- Cyfrowy identyfikator dokumentu elektronicznego link otwiera się w nowej karcie 10.15199/59.2016.8-9.74
- Kategoria
- Publikacja w czasopiśmie
- Typ
- artykuły w czasopismach recenzowanych i innych wydawnictwach ciągłych
- Język
- polski
- Rok wydania
- 2016