Detail výsledku
DiariZen
Vznik: 2024
Typ
software
Jazyk
angličtina
Autoři
Popis
DiariZen is a cutting-edge speaker diarization toolkit developed by BUT Speech@FIT, combining end-to-end neural diarization (EEND) based on WavLM and Conformer with VBx clustering for accurate and scalable “who spoke when” analysis. Built on the Pyannote framework, it offers modularity, reproducibility, and seamless integration into speech processing pipelines. Structured pruning ensures efficiency without sacrificing performance.
Klíčová slova
speech recognition, speaker, diarization, toolkit, clustering
URL
Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Projekty
Jazykověda, umělá inteligence a jazykové a řečové technologie: od výzkumu k aplikacím, EU, MEZISEKTOROVÁ SPOLUPRÁCE, EH23_020/0008518, zahájení: 2025-01-01, ukončení: 2028-12-31, řešení
Výzkumné skupiny
Pracoviště