Detail práce

Intersession Variability Compensation in Language and Speaker Identification

Diplomová práce Student: Hubeika Valiantsina Akademický rok: 2007/2008 Vedoucí: Matějka Pavel, Ing., Ph.D.
Název česky
Intersession Variability Compensation in Language and Speaker Identification
Jazyk práce
anglický
Abstrakt

Variabilita kanálu a hovoru je velmi důležitým problémem v úloze rozpoznávání mluvčího. V současné době je ve velkém množství vědeckých článků uvedeno několik technik pro kompenzaci vlivu kanálu. Kompenzace vlivu kanálu může být implementována jak v doméně modelu, tak i v doménách příznaků i skóre. Relativně nová výkoná technika je takzvaná eigenchannel adaptace pro GMM (Gaussian Mixture Models). Mevýhodou této metody je nemožnost její aplikace na jiné klasifikátory, jako napřílad takzvané SVM (Support Vector Machines), GMM s různým počtem Gausových komponent nebo v rozpoznávání řeči s použitím skrytých markovových modelů (HMM). Řešením může být aproximace této metody, eigenchannel adaptace v doméně příznaků. Obě tyto techniky, eigenchannel adaptace v doméně modelu a doméně příznaků v systémech rozpoznávání mluvčího, jsou uvedeny v této práci. Po dosažení dobrých výsledků v rozpoznávání mluvčího, byl přínos těchto technik zkoumán pro akustický systém rozpoznávání jazyka zahrnující 14 jazyků. V této úloze má nežádoucí vliv nejen variabilita kanálu, ale i variabilita mluvčího. Výsledky jsou prezentovány na datech definovaných pro evaluaci rozpoznávání mluvčího z roku 2006 a evaluaci rozpoznávání jazyka v roce 2007, obě organizované Amerických Národním Institutem pro Standard a Technologie (NIST)

Klíčová slova

Rozpoznánání mluvčího, rozpoznávání jazyka, akustický systém, variabilita kanálu, variabilita mluvčího, kompenzace kanálu, eigenchannel adaptace

Ústav
Studijní program
Informační technologie, obor Počítačová grafika a multimédia
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
16. června 2008
Oponent
Komise
Meduna Alexander, prof. RNDr., CSc. (UIFS FIT VUT), předseda
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), člen
Fučík Otto, doc. Dr. Ing. (UPSY FIT VUT), člen
Kršek Přemysl, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Sochor Jiří, prof. Ing., CSc. (FI MUNI), člen
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), člen
Citace
HUBEIKA, Valiantsina. Intersession Variability Compensation in Language and Speaker Identification. Brno, 2008. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2008-06-16. Vedoucí práce Matějka Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/7049/
BibTeX
@mastersthesis{FITMT7049,
    author = "Valiantsina Hubeika",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Intersession Variability Compensation in Language and Speaker Identification",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2008,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/7049/"
}
Nahoru