sv-COVID-19
https://doi.org/10.23695/K6FH-4F59
sv-covid-19 är en samling svenska nyhetestexter, vetenskapliga och
populärvetenskapliga artiklar och artiklar från vissa bloggar och
sociala medier, till exempel Flashback och Twitter, som började
publiceras i början av coronaviruspandemin (tidigt 2020). Korpusen
består av drygt åtta miljoner ord och 9000 artiklar. Korpusen
innehåller olika texttyper och texter med olika stilnivåer. Texterna
har märkts upp med ordklasstaggar, morfologisk analys och lemma, samt
viss strukturell och funktionell information, som till exempel
författarnamn.
Gå till källa för data
Öppnas i en ny tabbhttps://doi.org/10.23695/K6FH-4F59
Citering och åtkomst
Citering och åtkomst
Skapare/primärforskare:
Forskningshuvudman:
Citering:
Licens:
Språk:
Administrativ information
Administrativ information
slug:
sv-covid-19
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Nyckelord:
- Language Technology (Computational Linguistics)
- news texts
- social media
- scientific articles
- medical articles
- corpus
Metadata
Metadata
