Detail práce

Classification of Potentially Malicious File Clusters via Machine Learning

Bakalářská práce Student: Holop Patrik Akademický rok: 2018/2019 Vedoucí: Bartík Vladimír, Ing., Ph.D.
Název česky
Classification of Potentially Malicious File Clusters via Machine Learning
Jazyk práce
anglický
Abstrakt

Táto práca navrhuje alternatívu súčasných metód klasifikácie malvéru na úrovni súborov, ktoré sú často založené na detekcii špecifických postupností bytov v daných súboroch. Experimentáciou bolo potvrdené, že je možné klasifikovať potenciálnu hrozbu aj na úrovni zoskupení súborov založenej na spoločných vlastnostiach súborov v danom zoskupení. To bolo dosiahnuté dôkladným výberom vlastností troch typov súborov - PE, APK a .NET. Porovnaním niekoľkých metód strojového učenia boli vybraté klasifikátory s najvyššou presnosťou a implementovaná webová služba poskytujúca API pre klasifikáciu, ktoré bolo použité pre integráciu s interným systémom spoločnosti Avast zodpovedného za tvorbu súborových zoskupení. Táto práca taktiež diskutuje možné nedostatky a navrhuje kroky pre zlepšenie dosiahnutej presnosti klasifikácie.

Klíčová slova

strojové učenie, zhlukovanie, klasifikácia, antivírus, analýza, malvér

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení A
Obhajoba
12. června 2019
Oponent
Průběh obhajoby

Student nejprve prezentoval výsledky, kterých dosáhl v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Student následně odpověděl na otázky oponenta a na další otázky přítomných. Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studenta na položené otázky rozhodla práci hodnotit stupněm A.

Otázky u obhajoby
  1. Na základě čeho byly voleny hodnoty hyperparametrů u metody Random forest?
  2. V závěru uvádíte, že z experimentů vyplynulo, že klasifikace malware na úrovni shluků souborů typu PE, APK a .NET je možná s nižší přesností než při klasickém použití úrovně souborů. O jak velký rozdíl se jedná a jakou výhodou je vyvážen?
Komise
Hruška Tomáš, prof. Ing., CSc. (UIFS FIT VUT), předseda
Bidlo Michal, doc. Ing., Ph.D. (UPSY FIT VUT), člen
Češka Milan, doc. RNDr., Ph.D. (UITS FIT VUT), člen
Kreslíková Jitka, doc. RNDr., CSc. (UIFS FIT VUT), člen
Szőke Igor, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
HOLOP, Patrik. Classification of Potentially Malicious File Clusters via Machine Learning. Brno, 2019. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2019-06-12. Vedoucí práce Bartík Vladimír. Dostupné z: https://www.fit.vut.cz/study/thesis/21927/
BibTeX
@bachelorsthesis{FITBT21927,
    author = "Patrik Holop",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Classification of Potentially Malicious File Clusters via Machine Learning",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2019,
    location = "Brno, CZ",
    language = "english",
    url = "https://www.fit.vut.cz/study/thesis/21927/"
}
Nahoru