Aktualita
Kategorie: novinka
Dne: 11. listopadu 2025
V listopadu obhajuje svou disertační práci Ján Čegiň z Ústavu počítačové grafiky a multimédií
Ing. Ján Čegiň představí svou disertační práci v úterý 25. 11. 2025 od 9:30 v místnosti G108. Práce s titulem „Strojové učení s aktivním zapojením človeka pro textovou augmentacu v ére LLM“ / „Machine Learning With Human in the Loop for Textual Augmentation in the Era of Llms“. Práci vedl v roli školitele doc. Jakub Šimko (ÚPGM).
Čegiňova práce reaguje na rychlý pokrok v oblasti velkých jazykových modelů (LLM), který vzbudil zájem o jejich potenciál pro zlepšení procesů augmentace dat, zejména ve srovnání s tradičními metodami založenými na lidské práci. Vytváření nových trénovacích dat bez nutnosti shromažďovat další reálné vzorky je klíčové pro zlepšování modelů umělé inteligence. Tradičně tento proces vyžadoval nákladné a časově náročné crowdsourcingové úsilí. Práce zkoumá, jak mohou velké jazykové modely (LLM) nejen nahradit lidské pracovníky, ale v některých případech je dokonce překonat v generování rozmanitých, platných a nákladově efektivních trénovacích dat. „Tato práce propojuje techniky lidské výpočetní práce a umělou inteligenci a vytváří prostor pro efektivnější, škálovatelnější a udržitelnější přístupy k trénování menších a efektivnějších modelů,“ shrnuje nejobecněji přínos práce sám autor.
Čegiň se ve svém výzkumu zabývá těmito hlavními otázkami:
- Jaká je efektivnost LLM ve srovnání s lidskými pracovníky při augmentaci dat?
- Jaká je přenositelnost lidských výpočetních technik do LLM promptingu?
- Jaké jsou náklady a přínosy přístupu založeného na LLM ve srovnání s tradičními metodami?
Prostřednictvím rozsáhlých experimentů Čegiň dokazuje, že LLM mohou generovat rozmanitější a platnější textová data než lidští pracovníci a zároveň výrazně snižují náklady. „Ukázali jsme také, že techniky inspirované lidským chováním (např. poskytování příkladů jako nápovědy) zlepšují výkon následných modelů. A také jsme zjistili, že rozšíření založené na LLM je obzvláště cenné v prostředí s nedostatkem dat, resp. když je k dispozici jen málo označených příkladů.“
S abstraktem disertační práce se můžete seznámit zde.

Na obhajobu jste srdečně zváni!