Detail výsledku
AN ATTENTION-BASED BACKEND ALLOWING EFFICIENT FINE-TUNING OF TRANSFORMER MODELS FOR SPEAKER VERIFICATION
Vznik: 2024
Typ
software
Jazyk
angličtina
Autoři
Peng Junyi, UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Stafylakis Themos
Mošner Ladislav, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Stafylakis Themos
Mošner Ladislav, Ing., Ph.D., UPGM (FIT)
Burget Lukáš, doc. Ing., Ph.D., UPGM (FIT)
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
Popis
MHFA is an advanced speaker extractor back-end applied to layerwise representations of speech foundation models. It has been successfully used not only in speaker verification, but also in tasks and challenges such as anti-spoofing, language identification, and target speech processing.
Klíčová slova
speech recognition, target speech processing, speaker, verification, anti-spoofing, language identification
URL
Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Projekty
Jazykověda, umělá inteligence a jazykové a řečové technologie: od výzkumu k aplikacím, EU, MEZISEKTOROVÁ SPOLUPRÁCE, EH23_020/0008518, zahájení: 2025-01-01, ukončení: 2028-12-31, řešení
Výzkumné skupiny
Pracoviště