Detail publikace

IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model

FAJČÍK Martin, SMRŽ Pavel, MOTLÍČEK Petr a BURDISSO Sergio a kol. IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model. In: Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022). Abu Dhabi: Association for Computational Linguistics, 2022, s. 70-78. ISBN 978-1-959429-05-0. Dostupné z: https://aclanthology.org/2022.case-1.10/
Název česky
IDIAPers @ Causal News Corpus 2022: Extrahování tripletů příčina-účinek-signál prostřednictvím předtrénovaného autoregresivního jazykového modelu
Typ
článek ve sborníku konference
Jazyk
angličtina
Autoři
Fajčík Martin, Ing. (UPGM FIT VUT)
Smrž Pavel, doc. RNDr., Ph.D. (UPGM FIT VUT)
Motlíček Petr, doc. Ing., Ph.D. (UPGM FIT VUT)
a další
URL
Klíčová slova

extrakce kauzálnych vztahov, kauzálne vztahy, príčina, signál, následek, novinové média,

Abstrakt

V tomto článku popisujeme podúkol 2 v CASE-2022, Event Causality Identification with Casual News Corpus. Výzva se zaměřila na automatickou detekci všech textovych rozsahů příčina-následok-signál konstrukcí přítomných ve větě ze zpravodajských médií. Rozsahy zjišťujeme pomocí T5 --- předtrénovaného autoregresivního jazykového modelu. Iterativně identifikujeme všechny triplety textovych rozsahů příčina-následek-signál, přičemž vždy podmiňujeme predikci dalšího tripletu na dříve predikovaných. Abychom predikovali samotný triplet, uvažujeme různé kauzální vztahy, jako napr. příčina->následek->signál. Každá složka tripletu je generována pomocí jazykového modelu podmíněného větou, předchozími částmi aktuálního tripletu a dříve predikovanými triplety. Navzdory tréninku na extrémně malém datovém souboru 160 vzorků náš přístup dosáhl konkurenceschopného výkonu a umístil se na druhém místě v soutěži. Dále ukazujeme, že za kauzalnych predpokladov příčina->následek, nebo následek->příčina, dosáhne systém podobných výsledků.

Rok
2022
Strany
70-78
Sborník
Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022)
Konference
Conference on Empirical Methods in Natural Language Processing, Abu Dhabi, AE
ISBN
978-1-959429-05-0
Vydavatel
Association for Computational Linguistics
Místo
Abu Dhabi, AE
DOI
EID Scopus
BibTeX
@INPROCEEDINGS{FITPUB12838,
   author = "Martin Faj\v{c}\'{i}k and Pavel Smr\v{z} and Petr Motl\'{i}\v{c}ek and Sergio Burdisso and et al.",
   title = "IDIAPers @ Causal News Corpus 2022: Extracting Cause-Effect-Signal Triplets via Pre-trained Autoregressive Language Model",
   pages = "70--78",
   booktitle = "Proceedings of the 5th Workshop on Challenges and Applications of Automated Extraction of Socio-political Events from Text (CASE 2022)",
   year = 2022,
   location = "Abu Dhabi, AE",
   publisher = "Association for Computational Linguistics",
   ISBN = "978-1-959429-05-0",
   doi = "10.18653/v1/2022.case-1.10",
   language = "english",
   url = "https://www.fit.vut.cz/research/publication/12838"
}
Nahoru