Detail projektu
Jazykověda, umělá inteligence a jazykové a řečové technologie: od výzkumu k aplikacím
Období řešení: 1. 1. 2025 – 31. 12. 2028
Typ projektu: grant
Kód: EH23_020/0008518
Agentura: Evropská unie
Program: MEZISEKTOROVÁ SPOLUPRÁCE
Umělá inteligence, jazykové a řečové technologie
Cílem projektu "Umělá inteligence a jazykové a řečové technologie: od výzkumu
k aplikacím" je:
1. Prohloubení a realizace spolupráce mezi výzkumnými organizacemi a aplikační
sférou: konkrétně mezi Univerzitou Karlovou (Ústav formální a aplikované
lingvistiky MFF UK); Vysokým učením technickým v Brně (Fakulta informačních
technologií, FIT VUT) a firmami Phonexia s.r.o.; Mamma AI Coolma, s.r.o.
a Phrase, a.s. například ve věci vzájemné výměny znalostí, ověření parametrů
výzkumných výsledků pro jejich uplatnění v praxi a získání přístupu podniků
k hraničnímu poznání a pokročilým metodám, modelům a technologiím.
2. Realizace naplánovaného komplexního výzkumného záměru a čtyřech pracovních
balíčků (WP) ve spolupráci se subjekty aplikační sféry, zejména s Phonexia
s.r.o.; Mamma AI Coolma, s.r.o. a Phrase a.s. a s dalšími spolupracujícími
subjekty.
3. Příprava a podání společně zpracovaných projektových žádostí se subjekty
z aplikační sféry: zejména v oblastech navazujících na plánované čtyři pracovní
balíčky v rámci VZ1, a to účastí v národních i mezinárodních soutěžích/programech
či v přístupových projektech ke kapacitám velkých výzkumných infrastruktur
4. Zapojení zástupců aplikační sféry do výuky: zejména potom odborníků z Phonexia
s.r.o.; Mamma AI Coolma, s.r.o. a Phrase a.s., případně dalších spolupracujících
subjektů v tématech souvisejících s navrženou výzkumnou agendou.
Burget Lukáš, doc. Ing., Ph.D. (UPGM)
Diez Sánchez Mireia, M.Sc., Ph.D. (UPGM)
Han Jiangyu (UPGM)
Heřmanský Hynek, prof. Ing., Dr. Eng. (UPGM)
Jírovec Martin, Ing. (DFIT-děkan)
Kesiraju Santosh, Ph.D. (UPGM)
Kocmanová Martina, Ing. (VCIT)
Kudla Radim, Ing. (UPGM)
Mošner Ladislav, Ing. (UPGM)
Polok Alexander, Ing. (UPGM)
Szőke Igor, Ing., Ph.D. (UPGM)
Vendrame Katia, Ing. (UPGM)
2025
- HAN, J.; LANDINI, F.; ROHDIN, J.; SILNOVA, A.; DIEZ SÁNCHEZ, M.; BURGET, L. Leveraging Self-Supervised Learning for Speaker Diarization. Proceedings of ICASSP 2025. Hyderabad: IEEE Biometric Council, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail - PENG, J.; ASHIHARA, T.; DELCROIX, M.; OCHIAI, T.; PLCHOT, O.; ARAKI, S.; ČERNOCKÝ, J. TS-SUPERB: A Target Speech Processing Benchmark for Speech Self-Supervised Learning Models. Proceedings of ICASSP 2025. Hyderabad: IEEE Biometric Council, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail - PENG, J.; MOŠNER, L.; ZHANG, L.; PLCHOT, O.; STAFYLAKIS, T.; BURGET, L.; ČERNOCKÝ, J. CA-MHFA: A Context-Aware Multi-Head Factorized Attentive Pooling for SSL-Based Speaker Verification. Proceedings of ICASSP 2025. Hyderabad: IEEE Biometric Council, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail - POLOK, A.; KLEMENT, D.; KOCOUR, M.; HAN, J.; LANDINI, F.; YUSUF, B.; WIESNER, M.; KHUDANPUR, S.; ČERNOCKÝ, J.; BURGET, L. DiCoW: Diarization-Conditioned Whisper for Target Speaker Automatic Speech Recognition. COMPUTER SPEECH AND LANGUAGE, 2025,
p. 1-39. ISSN: 0885-2308. Detail - POLOK, A.; KLEMENT, D.; WIESNER, M.; KHUDANPUR, S.; ČERNOCKÝ, J.; BURGET, L. Target Speaker ASR with Whisper. Proceedings of ICASSP 2025. Hyderabad: IEEE Biometric Council, 2025.
p. 1-5. ISBN: 979-8-3503-6874-1. Detail