Detail výsledku
Factors affecting the in-context learning abilities of LLMs for dialogue state tracking
Kesiraju Santosh, Ph.D., UPGM (FIT)
Švec Ján, Ing., UPGM (FIT)
Sedláček Šimon, Ing., UPGM (FIT)
Yusuf Bolaji, UPGM (FIT)
Plchot Oldřich, Ing., Ph.D., UPGM (FIT)
Deepak K. T.
Černocký Jan, prof. Dr. Ing., UPGM (FIT)
This study explores the application of in-context learning (ICL) to the dialogue state tracking (DST) problem and investigates the factors that influence its effectiveness. We use a sentence embedding based k-nearest neighbour method to retrieve the suitable demonstrations for ICL. The selected demonstrations, along with the test samples, are structured within a template as input to the LLM. We then conduct a systematic study to analyse the impact of factors related to demonstration selection and prompt context on DST performance. This work is conducted using the MultiWoZ2.4 dataset and focuses primarily on the OLMo-7B-instruct, Mistral-7B-Instruct-v0.3, and Llama3.2-3B-Instruct models. Our findings provide several useful insights on in-context learning abilities of LLMs for dialogue state tracking.
dialog state tracking | in-context learning
@inproceedings{BUT199388,
author="Pradyoth {Hegde} and Santosh {Kesiraju} and Ján {Švec} and Šimon {Sedláček} and Bolaji {Yusuf} and Oldřich {Plchot} and {} and Jan {Černocký}",
title="Factors affecting the in-context learning abilities of LLMs for dialogue state tracking",
booktitle="Proceedings of the Annual Conference of the International Speech Communication Association Interspeech",
year="2025",
journal="Interspeech",
pages="4818--4822",
publisher="International Speech Communication Association",
address="Rotterdam, The Netherlands",
doi="10.21437/Interspeech.2025-2071",
url="https://www.isca-archive.org/interspeech_2025/hegde25_interspeech.pdf"
}
Multilingvální a mezikulturní interakce v dialogových systémech pro bezpečnostně kritické aplikace závislé na kontextu a kontrolou zaujatosti, EU, HORIZON EUROPE, zahájení: 2024-01-01, ukončení: 2026-12-31, řešení
Praktické ověření možnosti integrace umělé inteligence pro příjem tísňových volání pomocí hlasového chatbota, vyvinutého v rámci výzkumného projektu BV č. VI20192022169, s technologií pro příjem tísňové komunikace 112 a 150 v ČR (TCTV 112), MV, 1 VS OPSEC, VK01020132, zahájení: 2023-01-06, ukončení: 2025-10-31, ukončen
Vylepšování robustních a kreativních technologií lidského jazyka prostřednictvím akcí a výzkumu CHallenge, EU, European Defence Fund, zahájení: 2024-12-01, ukončení: 2029-11-30, řešení