Detail práce

Modelování jazyka v rozpoznávání češtiny

Diplomová práce Student: Mikolov Tomáš Akademický rok: 2006/2007 Vedoucí: Smrž Pavel, doc. RNDr., Ph.D.

Název anglicky

Language Modeling for Spech Recognition in Czech

Jazyk práce

český

Abstrakt

Tato práce se zabývá problematikou jazykových modelů v oblasti automatického přepisu mluvené řeči. V teoretické části jsou rozebrány současně používané metody pro pokročilé jazykové modelování založené na statistickém přístupu - modely založené na třídách, na faktorech a na neuronových sítích. Následně je popsána implementace jazykového modelu založeného na dvou neuronových sítích. V závěru práce jsou uvedeny výsledky dosažené na Pražském a Brněnském mluveném korpusu (cca 1 170 000 slov) - redukce perplexity o zhruba 20%. Výsledky dosažené při reskórování N-best listů ukazují zlepšení při rozpoznávání spontánní řeči o více než 1%. V závěru práce jsou uvedeny možnosti využití práce, její možná rozšíření a také jsou uvedeny hlavní nevýhody současně používaných přístupů pro statistické jazykové modelování.

Klíčová slova

jazykový model, čeština, n-gramové statistiky, neuronové sítě, rozpoznávání řeči, umělá inteligence

Ústav

Ústav počítačové grafiky a multimédií FIT VUT v Brně

Studijní program

Informační technologie, obor Počítačová grafika a multimédia

Soubory

Text práce 443 kB

Stav

obhájeno, hodnocení A

Obhajoba

21. června 2007

Oponent

Černocký Jan, prof. Dr. Ing.

Komise

Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), předseda
Fučík Otto, doc. Dr. Ing. (UPSY FIT VUT), člen
Křena Bohuslav, Ing., Ph.D. (UITS FIT VUT), člen
Racek Stanislav, doc. Ing., CSc. (ZČU v Plzni), člen
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT), člen
Vojnar Tomáš, prof. Ing., Ph.D. (UITS FIT VUT), člen

Citace

MIKOLOV, Tomáš. Modelování jazyka v rozpoznávání češtiny. Brno, 2007. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2007-06-21. Vedoucí práce Smrž Pavel. Dostupné z: https://www.fit.vut.cz/study/thesis/3645/

BibTeX

@mastersthesis{FITMT3645,
    author = "Tom\'{a}\v{s} Mikolov",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Modelov\'{a}n\'{i} jazyka v rozpozn\'{a}v\'{a}n\'{i} \v{c}e\v{s}tiny",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2007,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/3645/"
}

Závěrečné práce