Detail práce

Statistická analýza dat z PDF souborů

Bakalářská práce Student: Oltmanová Kristína Akademický rok: 2020/2021 Vedoucí: Bartík Vladimír, Ing., Ph.D.
Jazyk práce
slovenský
Abstrakt

Táto práca sa zaoberá problematikou získavania dát z tabuliek dokumentov vo formáte PDF a ich následnou analýzou s využitím štatistických nástrojov. Cieľom práce je demonštrovať proces získania, spracovania a vyhodnocovania dát na dopredu stanovenej vzorke dokumentov typu PDF, ktoré z hľadiska programového spracovania tvoria konečnú množinu podskupín so spoločnými vlastnosťami. Práca najskôr predstavuje základy spracovania PDF súborov a základné matematické princípy, ktoré sú potrebné k zhodnoteniu štatistických parametrov získaných dát. Získané teoretické princípy sú následne uvedené do praxe a do programovej podoby v programovacom jazyku Python. Výsledná webová aplikácia je naprogramovaná s využitím knižnice Flask a je použiteľná na lokálnom serveri.

Klíčová slova

regulačný diagram, štatistická regulácia procesu, Shewhartov regulačný diagram, Hotellingov regulačný diagram, index spôsobilosti procesu, extrakcia tabuliek z PDF, štatistická analýza, Python, Flask, webová aplikácia

Ústav
Studijní program
Informační technologie
Soubory
Stav
obhájeno, hodnocení B
Obhajoba
18. června 2021
Oponent
Průběh obhajoby

Studentka nejprve prezentovala výsledky, kterých dosáhla v rámci své práce. Komise se poté seznámila s hodnocením vedoucího a posudkem oponenta práce. Studentka následně odpověděla na otázku oponenta a na další otázky přítomných (ohledně identifikace tabulek v PDF souborech a extrakce informací, zpracování informací z pohledu regulárních jazyků). Komise se na základě posudku oponenta, hodnocení vedoucího, přednesené prezentace a odpovědí studentky na položené otázky rozhodla práci hodnotit stupněm B - velmi dobře.

Otázky u obhajoby
  1. Pokud uživatel vybere ručně část pdf dokumentu, která obsahuje tabulku, jaká nastavení se potom použijí pro vlastní extrakci dat?
Komise
Kolář Dušan, doc. Dr. Ing. (UIFS FIT VUT), předseda
Burgetová Ivana, Ing., Ph.D. (UIFS FIT VUT), člen
Fučík Otto, doc. Dr. Ing. (UPSY FIT VUT), člen
Hrubý Martin, Ing., Ph.D. (UITS FIT VUT), člen
Španěl Michal, Ing., Ph.D. (UPGM FIT VUT), člen
Citace
OLTMANOVÁ, Kristína. Statistická analýza dat z PDF souborů. Brno, 2021. Bakalářská práce. Vysoké učení technické v Brně, Fakulta informačních technologií. 2021-06-18. Vedoucí práce Bartík Vladimír. Dostupné z: https://www.fit.vut.cz/study/thesis/23695/
BibTeX
@bachelorsthesis{FITBT23695,
    author = "Krist\'{i}na Oltmanov\'{a}",
    type = "Bakal\'{a}\v{r}sk\'{a} pr\'{a}ce",
    title = "Statistick\'{a} anal\'{y}za dat z PDF soubor\r{u}",
    school = "Vysok\'{e} u\v{c}en\'{i} technick\'{e} v Brn\v{e}, Fakulta informa\v{c}n\'{i}ch technologi\'{i}",
    year = 2021,
    location = "Brno, CZ",
    language = "slovak",
    url = "https://www.fit.vut.cz/study/thesis/23695/"
}
Nahoru