Téma disertační práce

Detekce hlasových podvrhů

Ak. rok 2024/2025

Ústav: Ústav počítačové grafiky a multimédií

Programy:
Informační technologie (DIT) - prezenční studium
Information Technology (DIT-EN) - prezenční studium

Práce začne seznámením se základy problematiky detekce hlasů deepfakes (deepfake detection, DFD) - s terminologií, dostupnými technikami, daty a mezinárodními evaluacemi výzvami (zejména AVSpoof), s historií a současným stavem technik a nástrojů pro rozpoznávání mluvčích (wespeaker toolkit), se současným stavem technik a nástrojů pro personalizovanou syntézu textu na řeč (pTTS) a převod hlasu. Prvním úkolem bude reprodukovat jeden nebo dva systémy DFD z AVSpoof 2021 (nebo novější evaluace), zkontrolovat, zda čísla odpovídají tomu, co je uváděno, prostudovat, jak systémy fungují, a následně napadnout systém(y) DFD AVSpoof 2021 pomocí několika aktuálních technik generování DFD. Hlavním úkolem PhD práce je navrhnout a implementovat způsoby, jak detekovat DFD (nebo napomoci detekci DFD) například tím, že (1) systém DFD bude znát pravou řeč cílového mluvčího (2) bude pracovat s artefakty, které by mohly být špatně zpracovány systémy pTTS, jako jsou například nádechy. (3) návrhem a implementací technik využívajících poznatky psychoakustiky (4) návrhem a implementací technik využívajících textové informace dostupné od cílového mluvčího (např. sociální sítě)..