Detail práce
Automatizovaná detekce závislostí datových struktur
Tato práce se zabývá problematikou automatizovaného získávání znalostí ze strukturovaných dat, konkrétně pak detekcí závislostí datových typů ve stromově strukturovaných datech. Práce je řešena v kontextu platformy Testos, která cílí na automatizaci softwarového testování. Cílem řešení je navrhnout a implementovat nástroj, jenž bude automatizovaně plánovat a spouštět dílčí detekce nad vzorky reálných datových struktur. Detekce budou vykonávány externími moduly označované jako detektory, se kterými bude nástroj spolupracovat. Vytvořené řešení je realizováno jako služba implementující algoritmus, jenž komunikuje s detektory prostřednictvím dobře definovaného protokolu a paralelně jim zadává požadavky na provádění dílčích detekcí, jejichž výsledky následně vyhodnocuje. Službu lze ovládat a úkolovat pomocí vytvořeného HTTP API. Výsledky detekcí, tj. zjištěné významy či závislosti ve vstupních datech, jsou využívány dalšími nástroji platformy Testos za účelem generovaní nových testovacích dat, jejichž struktura odpovídá vstupním vzorkům reálných dat.
strukturovaná data, analýza, abstraktní datový strom, stromová datová struktura, reportér, detektor, JSON, Testos, .NET Core, daty řízené testování
Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.
- Jak u detekce řešíte důvěru (confidence) k přiřazeným značkám? Detekce totiž není čistě ano/ne funkce (např. "12.2" může být datum, obecný řetězec, obecné číslo s pohyblivou čárkou, atd. s různou důvěrou).
- Je ukládán stav detektorů? Tzn. může se zpřesnit výsledek a důvěra detekce na základě již viděných hodnot (např. na stejných pozicích ve vstupních datech)?
- Diskutujte efektivitu Vašeho řešení pomocí konkrétních čísel; např. na přiloženém benchmarku samples.
Kekely Lukáš, Ing., Ph.D. (UPSY FIT VUT), člen
Křivka Zbyněk, Ing., Ph.D. (UIFS FIT VUT), člen
Rogalewicz Adam, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
@bachelorsthesis{FITBT22816, author = "Pavel Nov\'{a}\v{c}ek", type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce", title = "Automatizovan\'{a} detekce z\'{a}vislost\'{i} datov\'{y}ch struktur", school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}", year = 2020, location = "Brno, CZ", language = "czech", url = "https://www.fit.vut.cz/study/thesis/22816/" }