Detail výsledku

DiariZen

Vznik: 2024
Typ
software
Jazyk
angličtina
Autoři
Han Jiangyu, UPGM (FIT)
Pálka Petr, Ing., FIT (FIT), UPGM (FIT)
Popis

DiariZen is a cutting-edge speaker diarization toolkit developed by BUT Speech@FIT, combining end-to-end neural diarization (EEND) based on WavLM and Conformer with VBx clustering for accurate and scalable “who spoke when” analysis. Built on the Pyannote framework, it offers modularity, reproducibility, and seamless integration into speech processing pipelines. Structured pruning ensures efficiency without sacrificing performance.

Klíčová slova

speech recognition, speaker, diarization, toolkit, clustering

URL
Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Projekty
Jazykověda, umělá inteligence a jazykové a řečové technologie: od výzkumu k aplikacím, EU, MEZISEKTOROVÁ SPOLUPRÁCE, EH23_020/0008518, zahájení: 2025-01-01, ukončení: 2028-12-31, řešení
Výzkumné skupiny
Pracoviště
Nahoru