Jazykověda, umělá inteligence a jazykové a řečové technologie: od výzkumu k aplikacím

Název anglicky

Linguistics, Artificial Intelligence and Language and Speech Technologies: from Research to Applications

Typ

grant

Klíčová slova

Umělá inteligence, jazykové a řečové technologie

Abstrakt

Cílem projektu "Umělá inteligence a jazykové a řečové technologie: od výzkumu
k aplikacím" je:
1. Prohloubení a realizace spolupráce mezi výzkumnými
organizacemi a aplikační sférou: konkrétně mezi Univerzitou Karlovou (Ústav
formální a aplikované lingvistiky MFF UK); Vysokým učením technickým v Brně
(Fakulta informačních technologií, FIT VUT) a firmami Phonexia s.r.o.; Mamma AI
Coolma, s.r.o. a Phrase, a.s. například ve věci vzájemné výměny znalostí, ověření
parametrů výzkumných výsledků pro jejich uplatnění v praxi a získání přístupu
podniků k hraničnímu poznání a pokročilým metodám, modelům a technologiím.
2.
Realizace naplánovaného komplexního výzkumného záměru a čtyřech pracovních
balíčků (WP) ve spolupráci se subjekty aplikační sféry, zejména s Phonexia
s.r.o.; Mamma AI Coolma, s.r.o. a Phrase a.s. a s dalšími spolupracujícími
subjekty.
3. Příprava a podání společně zpracovaných projektových žádostí se
subjekty z aplikační sféry: zejména v oblastech navazujících na plánované čtyři
pracovní balíčky v rámci VZ1, a to účastí v národních i mezinárodních
soutěžích/programech či v přístupových projektech ke kapacitám velkých výzkumných
infrastruktur
4. Zapojení zástupců aplikační sféry do výuky: zejména potom
odborníků z Phonexia s.r.o.; Mamma AI Coolma, s.r.o. a Phrase a.s., případně
dalších spolupracujících subjektů v tématech souvisejících s navrženou výzkumnou
agendou.

Řešitelé

Černocký Jan, prof. Dr. Ing. (UPGM) – hlavní řešitel
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Han Jiangyu (UPGM)
Heřmanský Hynek, prof. Ing., Dr. Eng. (UPGM)
Jírovec Martin, Ing. (DFIT-děkan)
Kesiraju Santosh, Ph.D. (UPGM)
Kocmanová Martina, Ing. (VCIT)
Kudla Radim, Ing. (UPGM)
Mošner Ladislav, Ing. (UPGM)
Polok Alexander, Ing. (UPGM)
Singh Prachi, B.Tech., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Vendrame Katia, Ing. (UPGM)

Publikační výsledky

2025

HAN, J.; LANDINI, F.; ROHDIN, J.; SILNOVA, A.; DIEZ SÁNCHEZ, M.; BURGET, L. Leveraging Self-Supervised Learning for Speaker Diarization. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025. p. 1-5. ISBN: 979-8-3503-6874-1. Detail
PENG, J.; ASHIHARA, T.; DELCROIX, M.; OCHIAI, T.; PLCHOT, O.; ARAKI, S.; ČERNOCKÝ, J. TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025. p. 1-5. ISBN: 979-8-3503-6874-1. Detail
PENG, J.; MOŠNER, L.; ZHANG, L.; PLCHOT, O.; STAFYLAKIS, T.; BURGET, L.; ČERNOCKÝ, J. CA-MHFA: A Context-Aware Multi-Head Factorized Attentive Pooling for SSL-Based Speaker Verification. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025. p. 1-5. ISBN: 979-8-3503-6874-1. Detail
POLOK, A.; KLEMENT, D.; WIESNER, M.; KHUDANPUR, S.; ČERNOCKÝ, J.; BURGET, L. Target Speaker ASR with Whisper. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025. p. 1-5. ISBN: 979-8-3503-6874-1. Detail