Detail projektu
Pokročilé sémantické obohacování vícejazyčných kolekcí literárních textů
Období řešení: 1. 6. 2018 – 31. 10. 2021
Typ projektu: grant
Kód: LTC18054
Agentura: Ministerstvo školství, mládeže a tělovýchovy ČR
Program: INTER-EXCELLENCE - Podprogram INTER-COST

Sémantika; Extrakce metadat
Cílem projektu je přispět k aktivitám COST Akce CA 16204 - Distant-Reading -
v oblastech souvisejících se sémantickým obohacováním rozsáhlých souborů
literárních textů v různých jazycích. Budeme zkoumat a vyvíjet pokročilé metody
extrakce metadat a anotace obsahu, s cílem explicitní reprezentace široké škály
sémantických struktur v textech, nové techniky adaptace stávajících zdrojů
a nástrojů pro nové jazyky, oblasti a kontexty, a způsoby efektivní správy
shromážděných zdrojů a kontroly jejich kvality a konzistence.
2020
- JON, J.; FAJČÍK, M.; DOČEKAL, M.; SMRŽ, P. BUT-FIT at SemEval-2020 Task 4: Multilingual commonsense. In Proceedings of the Fourteenth Workshop on Semantic Evaluation. Barcelona: Association for Computational Linguistics, 2020.
p. 374-390. ISBN: 978-1-952148-31-6. Detail