Detail výsledku

Rozpoznávač řeči adaptovaný pro generování dialektologické transkripce z audionahrávek

Vznik: 2025
Název anglicky
Speech recognizer adapted for generating dialectological transcription from audio recordings
Typ
software
Jazyk
česky
Autoři
Karafiát Martin, Ing., Ph.D., UPGM (FIT)
Žižka Josef, Ing., UPGM (FIT)
Šimečková Marta
Stupňánek Bronislav
Popis

Systém na základě vstupní zvukové nahrávky automaticky generuje přepis mluveného
projevu do textu včetně zachování nářečních specifik, a to i jevů diferenčních, jimiž
nedisponuje spisovný jazyk. Výstup je formátován podle pravidel dialektologické transkripce,
která byla definována v Metodice pro převod strukturovaných znalostí z oboru dialektologie do strojového učení (Šimečková a kol., 2025, s. 56–62; dostupné online). Systém je optimalizován pro záznamy tradičních dialektů češtiny z území České republiky, přičemž dokáže zachytit regionální varianty češtiny, které standardní rozpoznávače řeči ignorují.

Popis anglicky

Based on the input audio recording, the system automatically generates a transcription of the spoken speech into text, including the preservation of dialect specifics, including differential phenomena that are not available in the standard language. The output is formatted according to the rules of dialectological transcription, which was defined in the Methodology for the Transfer of Structured Knowledge from the Field of Dialectology into Machine Learning (Šimečková et al., 2025, pp. 56–62; available online). The system is optimized for recordings of traditional Czech dialects from the Czech Republic, and can capture regional variants of Czech that standard speech recognizers ignore.

Klíčová slova

akustický přepis mluvené řeči, dialektologie, dialektologická transkripce,

Klíčová slova anglicky

acoustic transcription of spoken language, dialectology, dialectological transcription,

URL
Licence
K využití výsledku jiným subjektem je vždy nutné nabytí licence
Licenční poplatek
Poskytovatel licence na výsledek nepožaduje licenční poplatek
Projekty
Jazyková paměť regionů České republiky. Metody strojového učení pro uchování, dokumentaci a prezentaci nářečí českého jazyka, MK, NAKI III – program na podporu aplikovaného výzkumu v oblasti národní a kulturní identity na léta 2023 až 2030, DH23P03OVV010, zahájení: 2023-03-01, ukončení: 2027-12-31, řešení
Pracoviště
Nahoru