Detail práce
Záznam streamovaného audia
Skupina zpracování řeči na Fakultě Informačních technologií Vysokého učení technického v Brně poslední dobou dosahuje velmi dobrých výsledků v oblasti identifikace jazyků, pro další vývoj je zapotřebí získávat další data pro trénování a testování identifikačních nástrojů. Tato práce se zabývá získáváním potřebných dat. Jednak se zaměřuje na techniky zaznamenávání streamů internetových rádií a dále se snaží získávání mluvené řeči z těchto záznamů.Zvolený přístup se snaží využít nástrojů dostupných na fakultě nebo opensource programů. Prvním úkolem práce bylo získat záznamy z rádií vysílajících v požadovaných jazycích. Dále se snaží zhodnotit možnosti využití již existujícího fonémového rozpoznávače a programu ngram pro nalezení úseků řeči v získaných záznamech na základě jazykových modelů řeči a hudby.
záznam audio streamů, segmentace, phnrec, ngram