Detail práce

Neuronový strojový překlad pro jazykové páry s malým množstvím trénovacích dat

Bakalářská práce Student: Filo Denis Akademický rok: 2019/2020 Vedoucí: Jon Josef, Ing.
Název anglicky
Low-Resource Neural Machine Translation
Jazyk práce
český
Abstrakt

Táto práca sa zaoberá neurónovým strojovým prekladom pre tzv. low-resource jazyky. Cieľom bolo pomocou experimentov vyhodnotiť súčasné techniky a navrhnúť ich vylepšenia. Prekladové systémy v tejto práci využívali architektúru neurónových sietí transformer a boli natrénované pomocou frameworku Marian. Vybranými jazykovými pármi pre experimenty boli slovenčina s chorvátčinou a slovenčina so srbčinou. V experimentoch boli predmetom skúmania techniky transfer learning a semi-supervised learning.

Klíčová slova

neurónový strojový preklad, transformer, low-resource, transfer learning, semi-supervised learning, slovanské jazyky, slovenčina, chorvátčina

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
28. srpna 2020
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby
  1. Stručne popíšte skóre typu BLEU. Ako presne počítate BLEU skóre cez nástroj SacreBLEU? Uveďte príklad.
  2. Porovnával jste výsledky vašeho překladu s použitím existujícího řešení s použitím třetího jazyka?
  3. Prováděl jste nějaké úpravy frameworku, který jste použil?
  4. Jak definujete slovník?
Komise
Hliněná Dana, doc. RNDr., Ph.D. (UMAT FEKT VUT), předseda
Dytrych Jaroslav, Ing., Ph.D. (UPGM FIT VUT), člen
Herout Adam, prof. Ing., Ph.D. (UPGM FIT VUT), člen
Křena Bohuslav, Ing., Ph.D. (UITS FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Citace
FILO, Denis. Neuronový strojový překlad pro jazykové páry s malým množstvím trénovacích dat. Brno, 2020. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2020-08-28. Vedoucí práce Jon Josef. Dostupné z: https://www.fit.vut.cz/study/thesis/23087/
BibTeX
@bachelorsthesis{FITBT23087,
    author = "Denis Filo",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Neuronov\'{y} strojov\'{y} p\v{r}eklad pro jazykov\'{e} p\'{a}ry s mal\'{y}m mno\v{z}stv\'{i}m tr\'{e}novac\'{i}ch dat",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2020,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/23087/"
}
Nahoru