Detail práce

Multilingual Open-Domain Question Answering

Diplomová práce Student: Slávka Michal Akademický rok: 2020/2021 Vedoucí: Fajčík Martin, Ing.
Název česky
Vícejazyčný systém pro odpovídání na otázky nad otevřenou doménou
Jazyk práce
anglický
Abstrakt

Táto práca sa zaoberá automatickým viacjazyčným zodpovedaním na otázky v otvorenej doméne. V tejto práci sú navrhnuté prístupy k tejto málo prebádanej doméne. Konkrétne skúma, či: (i) použitie prekladu z angličtiny je dostačujúce, (ii) multilinguálne systémy vedia využiť preklad otázky do iných jazykov (iii) alebo je výhodnejšie nepoužívať žiaden preklad. Porovnávam použitie anglického systému založeného na modeli T5, ktorý využíva strojový preklad s natívne viacjazyčnými systémami založenými na viacjazyčnom modeli MT5. Anglický systém so strojovým prekladom mierne prekonáva svoje jednojazyčné náprotivky vo viacerých úlohách. Napriek tomu, že tento model bol natrénovaný na väčšom množstve dát zlepšenie nie je dostatočne signifikantné. To ukazuje, že použitie natívne viacjazyčných systémov je sľubným prístupom pre budúci výskum. Tiež prezentujem metódu získavania dokumentov v rôznych jazykoch pomocou algoritmu BM25 a porovnávam ju s anglickým retrievalom. Používanie viacjazyčných dôkazov sa javí ako prospešné a zlepšuje výkonnosť systému systémov.

Klíčová slova

Spracovanie Prirodzeného jazyka, Automatické Odpovedanie na Otázky, Získavanie Informácií, BM25, Transformers Reference

Ústav
Studijní program
Informační technologie a umělá inteligence, specializace Strojové učení
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
23. června 2021
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby
  1. Jak si vysvětlujete, že se lepší výkon překladače, hodnoceného podle BLEU, neprojevuje na lepších výsledcích, přestože přímo použití lidského překladu pozitivní vliv má.
  2. Můžete blíže popsat svoji implementaci?
Komise
Černocký Jan, prof. Dr. Ing. (UPGM FIT VUT), předseda
Bařina David, Ing., Ph.D. (UPGM FIT VUT), člen
Burget Lukáš, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Čadík Martin, doc. Ing., Ph.D. (UPGM FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Rozman Jaroslav, Ing., Ph.D. (UITS FIT VUT), člen
Citace
SLÁVKA, Michal. Multilingual Open-Domain Question Answering. Brno, 2021. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2021-06-23. Vedoucí práce Fajčík Martin. Dostupné z: https://www.fit.vut.cz/study/thesis/23369/
BibTeX
@mastersthesis{FITMT23369,
    author = "Michal Sl\'{a}vka",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Multilingual Open-Domain Question Answering",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2021,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/23369/"
}
Nahoru