Detail práce

Aplikace metody učení bez učitele na hledání podobných grafů

Diplomová práce Student: Sabo Jozef Akademický rok: 2020/2021 Vedoucí: Křivka Zbyněk, Ing., Ph.D.
Název anglicky
Application of Unsupervised Learning Methods in Graph Similarity Search
Jazyk práce
český
Abstrakt

Cieľom tejto diplomovej práce bolo v spolupráci s firmou Avast navrhnúť systém, ktorý dokáže dolovať znalosti z databázy grafov pomocou metód učenia bez učiteľa. Grafy, určené pre dolovanie, popisujú chovanie počítačových systémov a do databázy prichádzajú anonymne od používateľov softvérových produktov firmy. Grafom v databáze je možné priradiť jednu z dvoch tried: čistý graf alebo malware (škodlivý) graf. Úlohou navrhnutého samoučiacieho systému je nad grafovou databázou nájsť zhluky grafov, v ktorých sa triedy grafov nemiešajú. Zhluky grafov, v ktorých sa nachádza iba jedna trieda grafov, sa dajú interpretovať ako rôzne typy čistých alebo malware grafov a sú užitočným zdrojom ďalších analýz nad grafmi. Pre ohodnotenie kvality zhlukov bola navrhnutá vlastná metrika pomenovaná ako jednofarebnosť. Metrika hodnotí kvalitu zhlukov na základe toho ako veľmi sa v zhlukoch miešajú čisté a malware grafy. Najlepšie výsledky metrika dosiahla, keď boli vektorové reprezentácie grafov vytvorené modelom hlbokého učenia (variačným grafovým autoenkodérom s dvomi relačnými grafovými konvolučnými operátormi)  a pre zhlukovanie nad vektormi bola použitá bezparametrická metóda MeanShift.

Klíčová slova

graf, Avast, učenie bez učiteľa, zhlukovanie, detekcia komunít, vektorové reprezentácie uzlov, vektorové reprezentácie grafov, grafové neurónové siete

Ústav
Studijní program
Informační technologie a umělá inteligence, specializace Vývoj aplikací
Soubory
Stav
obhájeno, hodnocení C
Obhajoba
23. června 2021
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm C.

Otázky u obhajoby
  1. V technické zprávě uvádíte, že dostupná data byla rozdělena na trénovací, testovací a validační datovou sadu. Jak přesně byly využity jednotlivé datové sady při tvorbě samoučících systémů?
Komise
Zemčík Pavel, prof. Dr. Ing. (UPGM FIT VUT), předseda
Bartík Vladimír, Ing., Ph.D. (UIFS FIT VUT), člen
Holík Lukáš, doc. Mgr., Ph.D. (UITS FIT VUT), člen
Kreslíková Jitka, doc. RNDr., CSc. (UIFS FIT VUT), člen
Orság Filip, Ing., Ph.D. (UITS FIT VUT), člen
Polčák Libor, Ing., Ph.D. (UIFS FIT VUT), člen
Citace
SABO, Jozef. Aplikace metody učení bez učitele na hledání podobných grafů. Brno, 2021. Diplomová práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2021-06-23. Vedoucí práce Křivka Zbyněk. Dostupné z: https://www.fit.vut.cz/study/thesis/23791/
BibTeX
@mastersthesis{FITMT23791,
    author = "Jozef Sabo",
    type = "Diplomov\'{a} pr\'{a}ce",
    title = "Aplikace metody u\v{c}en\'{i} bez u\v{c}itele na hled\'{a}n\'{i} podobn\'{y}ch graf\r{u}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2021,
    location = "Brno, CZ",
    language = "czech",
    url = "https://www.fit.vut.cz/study/thesis/23791/"
}
Nahoru