Detail práce

Adaptace rozpoznávače řeči na datech bez přepisu

Diplomová práce Student: Švec Ján Akademický rok: 2014/2015 Vedoucí: Schwarz Petr, Ing., Ph.D.
Název anglicky
Unsupervised Adaptation of Speech Recognizer
Jazyk práce
český
Abstrakt

Cílem práce je vytvořit a otestovat techniky pro adaptaci rozpoznávače řeči na audionahrávkach bez slovního přepisu. Nejprve připravíme data pro trenovaní rozpoznavače řeči a natrénujeme počáteční systém. Tímto rozpoznavačem přepišeme neznáma data a zaměříme se na experimentování s výběrem kvalitních adaptačních dat na základě míry kvality přepisu. Systém na nově vytvořené sadě přetrénujeme a vyhodnotíme úspešnost. Dále experimentujeme s množstvím adaptačních dat.

Klíčová slova

rozpoznávaní řeči, akustický model, jazykový model, konfidence, adaptace

Ústav
Studijní program
Informační technologie, obor Počítačová grafika a multimédia
Soubory
Stav
obhájeno, hodnocení E
Obhajoba
25. června 2015
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm E.

Otázky u obhajoby
  • V textu se zmiňujete velké množství externích zdrojů (titulky, web...) pro tvorbu jazykového modelu. Byly tyto data přidány k původním přepisům se stejnou váhou, nebo byla tvorba jazykového modelu optimalizována?
  • Jak se změní úspěšnost pokud zadaptujete již adaptovaný systém. 
  • Myslíte že způsob jakým je měřena věrohodnost ("confidence") je plně dostačující nebo by šel nadále vylepšit.Pokud ano, jaký způsob by jste navrhoval.

    

Komise
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT), předseda
Herout Adam, prof. Ing., Ph.D. (UPGM FIT VUT), člen
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Sedlák Petr, doc. Ing., Ph.D. (UFYZ FEKT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Vašíček Zdeněk, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Citace
ŠVEC, Ján. Adaptace rozpoznávače řeči na datech bez přepisu. Brno, 2015. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2015-06-25. Vedoucí práce Schwarz Petr. Dostupné z: https://www.fit.vut.cz/study/thesis/17301/
BibTeX
@mastersthesis{FITMT17301,
    author = "J\'{a}n \v{S}vec",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Adaptace rozpozn\'{a}va\v{c}e \v{r}e\v{c}i na datech bez p\v{r}episu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2015,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/17301/"
}
Nahoru