Detail projektu
Jazykověda, umělá inteligence a jazykové a řečové technologie: od výzkumu k aplikacím
Období řešení: 1. 1. 2025 – 31. 12. 2028
Typ projektu: grant
Kód: EH23_020/0008518
Agentura: Evropská unie
Program: MEZISEKTOROVÁ SPOLUPRÁCE
Umělá inteligence, jazykové a řečové technologie
Cílem projektu "Umělá inteligence a jazykové a řečové technologie: od výzkumu
k aplikacím" je:
1. Prohloubení a realizace spolupráce mezi výzkumnými
organizacemi a aplikační sférou: konkrétně mezi Univerzitou Karlovou (Ústav
formální a aplikované lingvistiky MFF UK); Vysokým učením technickým v Brně
(Fakulta informačních technologií, FIT VUT) a firmami Phonexia s.r.o.; Mamma AI
Coolma, s.r.o. a Phrase, a.s. například ve věci vzájemné výměny znalostí, ověření
parametrů výzkumných výsledků pro jejich uplatnění v praxi a získání přístupu
podniků k hraničnímu poznání a pokročilým metodám, modelům a technologiím.
2.
Realizace naplánovaného komplexního výzkumného záměru a čtyřech pracovních
balíčků (WP) ve spolupráci se subjekty aplikační sféry, zejména s Phonexia
s.r.o.; Mamma AI Coolma, s.r.o. a Phrase a.s. a s dalšími spolupracujícími
subjekty.
3. Příprava a podání společně zpracovaných projektových žádostí se
subjekty z aplikační sféry: zejména v oblastech navazujících na plánované čtyři
pracovní balíčky v rámci VZ1, a to účastí v národních i mezinárodních
soutěžích/programech či v přístupových projektech ke kapacitám velkých výzkumných
infrastruktur
4. Zapojení zástupců aplikační sféry do výuky: zejména potom
odborníků z Phonexia s.r.o.; Mamma AI Coolma, s.r.o. a Phrase a.s., případně
dalších spolupracujících subjektů v tématech souvisejících s navrženou výzkumnou
agendou.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Han Jiangyu (UPGM)
Heřmanský Hynek, prof. Ing., Dr. Eng. (UPGM)
Jírovec Martin, Ing. (DFIT-děkan)
Kesiraju Santosh, Ph.D. (UPGM)
Kocmanová Martina, Ing. (VCIT)
Kudla Radim, Ing. (UPGM)
Mošner Ladislav, Ing. (UPGM)
Polok Alexander, Ing. (UPGM)
Singh Prachi, B.Tech., Ph.D. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Vendrame Katia, Ing. (UPGM)
2025
- HAN, J.; LANDINI, F.; ROHDIN, J.; SILNOVA, A.; DIEZ SÁNCHEZ, M.; BURGET, L. Leveraging Self-Supervised Learning for Speaker Diarization. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail - PENG, J.; ASHIHARA, T.; DELCROIX, M.; OCHIAI, T.; PLCHOT, O.; ARAKI, S.; ČERNOCKÝ, J. TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail - PENG, J.; MOŠNER, L.; ZHANG, L.; PLCHOT, O.; STAFYLAKIS, T.; BURGET, L.; ČERNOCKÝ, J. CA-MHFA: A Context-Aware Multi-Head Factorized Attentive Pooling for SSL-Based Speaker Verification. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail - POLOK, A.; KLEMENT, D.; WIESNER, M.; KHUDANPUR, S.; ČERNOCKÝ, J.; BURGET, L. Target Speaker ASR with Whisper. In ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing - Proceedings. Hyderabad: IEEE Signal Processing Society, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail