Tehničko veleučilište u Zagrebu · Zagreb

Metoda automatske analize brzine govora

izvorni znanstveni rad

izvorni znanstveni rad

Metoda automatske analize brzine govora

Vrsta prilog u časopisu
Tip izvorni znanstveni rad
Godina 2021
Časopis Polytechnic and design
Volumen 9
Svesčić 2
Stranice str. 74-81
DOI 10.19279/TVZ.PD.2021-9-2-01
ISSN 1849-1995
EISSN 2459-6302
Status objavljeno

Sažetak

U ovom radu opisana je metoda analize brzine govora ili tempa na osnovu uzoraka govora dobivenih s televizijskih kanala koji sadrže tekst izgovorenog u obliku titlova. Za prepoznavanje govora korištena je nepovratna neuronska mreža (engl. feed-forward neural network) trenirana s oko 160 sekundi govora. Da bi se odredile granice pojedinačnih riječi napravljena je komponenta za poravnavanje govora s tekstom koja pronalazi prihvatljivo podudaranje slova teksta s fonemima koje je klasificirala neuronska mreža. Komponenta za poravnavanje uzima u obzir kategorije fonema za koje neuronska mreža ima veću preciznost klasifikacije. Preliminarni rezultati pokazuju prosječne promašaje poravnavanja od jednog do tri fonema, zavisno od govornika, sadržaja izgovorenog i kvalitete snimke.

Ključne riječi

prepoznavanje govora, poravnavanje, tempo, neuronska mreža