Detail práce

Konverze hlasu

Bakalářská práce Student: Hodaň David Akademický rok: 2015/2016 Vedoucí: Černocký Jan, prof. Dr. Ing.
Název anglicky
Voice Conversion
Jazyk práce
český
Abstrakt

Práce se zabývá problematikou konverze hlasu, což je transformace parametrů řeči jednoho řečníka tak, aby zněl jako někdo jiný. Je proveden rozbor metod odrážejících současný stav technik konverze. V teoretické části je nejprve přiblížen způsob tvorby řeči s důrazem na atributy identifikující a charakterizující hlas. Jsou popsány metody modifikace hlasu s jejich výhodami a úskalími, jež předurčují oblast použití daných metod. Dále jsou probrány způsoby transformace hlasu mezi zdrojovým a cílovým mluvčím. Na základě popsaných poznatků je vytvořen software demonstrující jednu z cest jak tohoto cíle dosáhnout. Konverze je rozdělena z pohledu trénování a syntézy. Součástí práce je program konverze hlasu, který byl vytvořen v programovém prostření MATLAB. Postupně je v práci popsán jeho návrh, implementace a zhodnocení dosažených výsledků.

Klíčová slova

zpracování řeči, konverze hlasu, syntéza hlasu, fonémový rozpoznávač, LPC, DTW

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení E
Obhajoba
15. června 2016
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm dostatečně (E).

Otázky u obhajoby
  1. Proč je vhodnější použít Hammingovo okno při výseku části signálu oproti obdelníkovému oknu (při odpovědi se zaměřte především na spektrální oblast signálu)?
  2. Může se stát, že při odhadu koeficientů LPC filtru bude filtr nestabilní?
Komise
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), předseda
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Drahanský Martin, prof. Ing., Dipl.-Ing., Ph.D. (UITS FIT VUT), člen
Rychlý Marek, RNDr., Ph.D. (UIFS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
HODAŇ, David. Konverze hlasu. Brno, 2016. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2016-06-15. Vedoucí práce Černocký Jan. Dostupné z: https://www.fit.vut.cz/study/thesis/18959/
BibTeX
@bachelorsthesis{FITBT18959,
    author = "David Hoda\v{n}",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Konverze hlasu",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2016,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/18959/"
}
Nahoru