MultiGEC

Masciolini, Arianna; Caines, Andrew; De Clercq, Orphée; Kruijsbergen, Joni; Kurfali, Murathan; Muñoz Sánchez, Ricardo; Volodina, Elena; Östling, Robert; Allkivi-Metsoja, Kais; Arhar Holdt, Špela; Auzina, Ilze; Darģis, Roberts; Drakonaki, Elena; Frey, Jennifer-Carmen; Glišić, Isidora; Kikilintza, Pinelopi; Nicolas, Lionel; Romanyshyn, Mariana; Rosen, Alexandr; Rozovskaya, Alla; Suluste, Kristjan; Syvokon, Oleksiy; Tantos, Alexandros; Touriki, Despoina-Ourania; Tsiotskas, Konstantinos; Tsourilla, Eleni; Varsamopoulos, Vassilis; Wisniewski, Katrin; Žagar, Aleš; Zesch, Torsten

doi:10.23695/H9F5-8143

MultiGEC

https://doi.org/10.23695/H9F5-8143

Dataset description MultiGEC is a dataset for Multilingual Grammatical Error Correction in 12 European languages (Czech, English, Estonian, German, Greek, Icelandic, Italian, Latvian, Russian, Slovene, Swedish and Ukrainian) compiled by the CompSLA working group and over 20 external data providers in the context of MultiGEC-2025, the first text-level GEC shared task. The MultiGEC dataset is divided into 17 subcorpora covering different languages, domains and correction styles, summarized below. More detailed information about each subcorpus is available as machine-readable metadata, whose format is described .

Go to data source

https://doi.org/10.23695/H9F5-8143

Citation and access

Creator/Principal investigator(s):

Masciolini, Arianna
Caines, Andrew
De Clercq, Orphée
Kruijsbergen, Joni
Kurfali, Murathan
Muñoz Sánchez, Ricardo
Volodina, Elena
Östling, Robert
Allkivi-Metsoja, Kais
Arhar Holdt, Špela
Auzina, Ilze
Darģis, Roberts
Drakonaki, Elena
Frey, Jennifer-Carmen
Glišić, Isidora
Kikilintza, Pinelopi
Nicolas, Lionel
Romanyshyn, Mariana
Rosen, Alexandr
Rozovskaya, Alla
Suluste, Kristjan
Syvokon, Oleksiy
Tantos, Alexandros
Touriki, Despoina-Ourania
Tsiotskas, Konstantinos
Tsourilla, Eleni
Varsamopoulos, Vassilis
Wisniewski, Katrin
Žagar, Aleš
Zesch, Torsten

Research principal:

University of Gothenburg
Opens a new window at ror.org.
ROR

Citation:

Administrative information

Identifiers

slug:

multigec

Topic and keywords

Swedish Standard Classification of Research Subjects 2025:

Keywords:

Relations

Is part of:

10.23695/svn8-rt31

Is part of:

10.23695/b4wj-b251

Metadata

MultiGEC

Citation and access

Creator/​Principal investigator(s):

Research principal:

Citation:

Administrative information

Identifiers

slug:

Topic and keywords

Swedish Standard Classification of Research Subjects 2025:

Keywords:

Relations

Is part of:

Is part of:

Metadata

Creator/Principal investigator(s):