Detail práce
Modelování dynamiky prosodie pro rozpoznávání řečníka
V současných systémech pro rozpoznání mluvčího se zpravidla využívají krátkodobé akustické příznaky. Jiné příznaky se používají jen zřídka. V práci se zaměřím na prosodické příznaky získané z průběhu základního tónu a energie. Tyto příznaky modelují průběh základního tónu v jednotlivých fonémech nebo slabikách. Z literatury je známo, že systémy založené na prosodii neposkytují tak dobré výsledky jako akustické, ale spojením akustického systému a systému založeného na prosodii se dosáhne značného zlepšení výsledků. To ověřím spojením s akustickým systémem vyvinutým na VUT. Při experimentech použiji data z evaluací pořádaných Národním úřadem pro standardy a technologie (NIST).
prosodie,základní tón,energie,identifikace mluvčího,ověření mluvčího, rozpoznání mluvčího, jazykový model, bigram, n-gram
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), člen
Fučík Otto, doc. Dr. Ing. (UPSY FIT VUT), člen
Kršek Přemysl, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Sochor Jiří, prof. Ing., CSc. (FI MUNI), člen
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), člen
@mastersthesis{FITMT6977, author = "Zden\v{e}k Jan\v{c}\'{i}k", type = "Diplomov\'{a} pr\'{a}ce", title = "Modelov\'{a}n\'{i} dynamiky prosodie pro rozpozn\'{a}v\'{a}n\'{i} \v{r}e\v{c}n\'{i}ka", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2008, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/6977/" }