Detail publikace

Automata with Bounded Repetition in RE2

HOLÍKOVÁ Lenka, HORKÝ Michal a SÍČ Juraj. Automata with Bounded Repetition in RE2. In: Computer Aided Systems Theory - EUROCAST 2022. Heidelberg: Springer Verlag, 2023, s. 232-239. ISSN 0302-9743.
Název česky
Automaty s omezeným opakováním v RE2
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Holíková Lenka, Ing. (UITS FIT VUT)
Horký Michal, Ing. (FIT VUT)
Síč Juraj, Mgr. (UITS FIT VUT)
Klíčová slova

RE2, regex

Abstrakt

Při vývoji softwaru má nezastupitelnou roli porovnávání regulárních výrazů (regex). Jedná se o výpočetně náročný proces, který se často aplikuje na rozsáhlé texty. Předvídatelnost jeho účinnosti má v praxi významný vliv na celkovou použitelnost softwarových aplikací. Problémem je, že standardní přístupy k regexovému porovnávání trpí vysokou složitostí v nejhorším případě. Nešťastná kombinace regexu a textu může prodloužit dobu porovnávání o řády. To může být vstupní branou pro tzv. útok odepření služby regulárním výrazem (Regular Expression Denial of Service, ReDoS), při kterém útočník způsobí odepření služby zadáním speciálně vytvořeného regexu nebo textu. Zaměříme se na jeden ze zdrojů těchto útoků, kterým jsou regexy s omezeným opakováním (např. "(ab)100"). Stručnou reprezentaci a rychlé porovnávání takových regexů lze archivovat pomocí nového automatu s počítací množinou. Představujeme implementaci párovacího algoritmu založeného na automatu počítající množiny v jazyce C++. Implementace je provedena v rámci programu RE2, což je rychlý regex matcher nejnovější generace. Provádíme experimenty na skutečných regexech. Experimenty ukazují, že implementace v rámci RE2 je rychlejší než původní implementace v jazyce C#.

Rok
2023
Strany
232-239
Časopis
Lecture Notes in Computer Science, č. 13789, ISSN 0302-9743
Sborník
Computer Aided Systems Theory - EUROCAST 2022
Konference
Eurocast 2022 -- 18th International Conference on Computer Aided Systems Theory, Las Palmas de Gran Canaria, Canary Islands, ES
Vydavatel
Springer Verlag
Místo
Heidelberg, DE
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB13001,
   author = "Lenka Hol\'{i}kov\'{a} and Michal Hork\'{y} and Juraj S\'{i}\v{c}",
   title = "Automata with Bounded Repetition in RE2",
   pages = "232--239",
   booktitle = "Computer Aided Systems Theory - EUROCAST 2022",
   journal = "Lecture Notes in Computer Science",
   number = 13789,
   year = 2023,
   location = "Heidelberg, DE",
   publisher = "Springer Verlag",
   ISSN = "0302-9743",
   doi = "10.1007/978-3-031-25312-6\_27",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/13001"
}
Nahoru