Aktualita

Kategorie: novinka

Dne: 11. listopadu 2025

V listopadu obhajuje svou disertační práci Ján Čegiň z Ústavu počítačové grafiky a multimédií

[img]

Ing. Ján Čegiň představí svou disertační práci v úterý 25. 11. 2025 od 9:30 v místnosti G108. Práce s titulem „Strojové učení s aktivním zapojením človeka pro textovou augmentacu v ére LLM“ / „Machine Learning With Human in the Loop for Textual Augmentation in the Era of Llms“. Práci vedl v roli školitele doc. Jakub Šimko (ÚPGM).

Čegiňova práce reaguje na rychlý pokrok v oblasti velkých jazykových modelů (LLM), který vzbudil zájem o jejich potenciál pro zlepšení procesů augmentace dat, zejména ve srovnání s tradičními metodami založenými na lidské práci. Vytváření nových trénovacích dat bez nutnosti shromažďovat další reálné vzorky je klíčové pro zlepšování modelů umělé inteligence. Tradičně tento proces vyžadoval nákladné a časově náročné crowdsourcingové úsilí. Práce zkoumá, jak mohou velké jazykové modely (LLM) nejen nahradit lidské pracovníky, ale v některých případech je dokonce překonat v generování rozmanitých, platných a nákladově efektivních trénovacích dat. „Tato práce propojuje techniky lidské výpočetní práce a umělou inteligenci a vytváří prostor pro efektivnější, škálovatelnější a udržitelnější přístupy k trénování menších a efektivnějších modelů,“ shrnuje nejobecněji přínos práce sám autor.

Čegiň se ve svém výzkumu zabývá těmito hlavními otázkami:

  1. Jaká je efektivnost LLM ve srovnání s lidskými pracovníky při augmentaci dat?
  2. Jaká je přenositelnost lidských výpočetních technik do LLM promptingu?
  3. Jaké jsou náklady a přínosy přístupu založeného na LLM ve srovnání s tradičními metodami?

Prostřednictvím rozsáhlých experimentů Čegiň dokazuje, že LLM mohou generovat rozmanitější a platnější textová data než lidští pracovnícizároveň výrazně snižují náklady. „Ukázali jsme také, že techniky inspirované lidským chováním (např. poskytování příkladů jako nápovědy) zlepšují výkon následných modelů. A také jsme zjistili, že rozšíření založené na LLM je obzvláště cenné v prostředí s nedostatkem dat, resp. když je k dispozici jen málo označených příkladů.“

S abstraktem disertační práce se můžete seznámit zde.

Na obhajobu jste srdečně zváni!

Sdílet článek

Nahoru