Engelsk-svensk guldstandard för ordlänkning (GES)
En referenskorpus för ordlänkning uppdelad på tränings- och testdata. Meningarna är hämtade från Europarl engelska respektive svenska delar.
Data är skapade från den engelsk-svenska delen av den parallella korpusen Europarl och utgörs, för varje meningspar, av par av tokenidentifierare på formen n-m där n och m är heltal.
Gå till källa för data
Öppnas i en ny tabbhttps://www.ida.liu.se/divisions/hcs/nlplab/resources/ges/
Citering och åtkomst
Citering och åtkomst
Tillgänglighetsnivå:
Skapare/primärforskare:
- Lars Ahrenberg - Linköpings universitet - Institutionen för datavetenskap
- Maria Holmqvist - Linköpings universitet - Institutionen för datavetenskap
Forskningshuvudman:
Citering:
Korpus
Korpus
Avsedd användning:
Språkteknologiskt datorprogram
Textdel
Textdel
Antal språk:
Tvåspråkig
Språk:
Engelska (eng)
:
Svenska (swe)
Meningar: 1164
Modalitet:
Skriftspråk
Storlek:
Meningar: 1164
Typ av uppmärkning:
Länkning
Manuell
Källa:
Länk till andra media:
Administrativ information
Administrativ information
Ansvarig institution/enhet:
Institutionen för datavetenskap
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Nyckelord:
Relationer
Relationer
Publikationer
Publikationer
Citering:
Maria Holmqvist and Lars Ahrenberg (2011). A Gold Standard for English-Swedish Word Alignment. In Proceedings of the 18th Nordic Conference on Computational Linguistics, Riga, Latvia, May 11-13, 2011.
Metadata
Metadata
Version 1

Linköpings universitet