Arabisk e-bokskorpus
https://doi.org/10.23695/XWZ6-JV19
Arabisk e-bokskorpus är en fritt tillgänglig samling av 1 745 böcker på arabiska, publicerade av Hindawi Foundation mellan 2008 och 2024. Böckerna är av olika genrer, bland annat, facktext, romaner, barnlitteratur, poesi och pjäser.
För ytterligare detaljer, se Hallberg, A. (2025). An 81-million-word multi-genre corpus of Arabic books. Data in Brief, 60, 111456.
Korpusen finns även tillgänglig för nedladdning i HTML-format och icke-formaterad ren text.
Gå till källa för data
Öppnas i en ny tabbhttps://doi.org/10.23695/XWZ6-JV19
Citering och åtkomst
Citering och åtkomst
Skapare/primärforskare:
Forskningshuvudman:
Citering:
Administrativ information
Administrativ information
slug:
arabic-ebooks
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Nyckelord:
- Language Technology (Computational Linguistics)
- corpus
Metadata
Metadata
