Detail publikace
Monant Medical Misinformation Dataset: Mapping Articles to Fact-Checked Claims
Pecher Branislav, Ing. (UPGM FIT VUT)
Tomlein Matúš
Móro Róbert
Štefancová Elena
Šimko Jakub, doc. Ing., Ph.D. (UPGM FIT VUT)
Bieliková Mária, prof. Ing., PhD. (UPGM FIT VUT)
medicínske dezinformace, datová sada, ověřování faktů, platforma Monant
Nepravdivé informace mají výrazný negativní vliv na jednotlivce i na celou společnost. Zejména v současné době COVID-19 jsme svědky nebývalého nárůstu lékařských dezinformací. Abychom pomohli vyřešit tento problém pomocí přístupů strojového učení, zveřejňujeme bohatou datovou sadu o velikosti cca. 317 tisíc zpráv/článků z blogů týkajícych se medicíny a 3,5 tisíc tvrzení ověřených fakty. Obsahuje také 573 manuálně a více než 51 tisíc předikovaných štítků mapujících tvrzení na články. Představují přítomnost tvrzení, tedy zda je v daném článku tvrzení obsaženo, a postoj článku k tomuto tvrzení. Pro tyto dva úkoly poskytujeme několik základních modelů strojového učení a vyhodnocujeme je na ručně označené části datové sady. Dataset umožňuje řadu dalších úkolů souvisejících s medicínskymi dezinformacemi, jako jsou studie charakterizace dezinformací nebo studie šíření dezinformací mezi zdroji.
@INPROCEEDINGS{FITPUB12680, author = "Ivan Srba and Branislav Pecher and Mat\'{u}\v{s} Tomlein and R\'{o}bert M\'{o}ro and Elena \v{S}tefancov\'{a} and Jakub \v{S}imko and M\'{a}ria Bielikov\'{a}", title = "Monant Medical Misinformation Dataset: Mapping Articles to Fact-Checked Claims", pages = "2949--2959", booktitle = "Proceedings of the 45th International ACM SIGIR Conference on Research and Development in Information Retrieval", year = 2022, location = "Madrid, ES", publisher = "Association for Computing Machinery", ISBN = "978-1-4503-8732-3", doi = "10.1145/3477495.3531726", language = "english", url = "https://www.fit.vut.cz/research/publication/12680" }