SIC2 - Stockholm Internet Corpus
https://doi.org/10.23695/SE5F-D274
The Stockholm Internet Corpus 2 (SIC2) contains Swedish blog posts, annotated with part of speech, morphological features, and named entities. Annotation was done by Robert Östling, Johan Sjons and Johannes Bjerva. Version 2 was created by Aleksandrs Berdicevskis by making minor changes in the annotation and the format (see below). The original version 1 can be found here. Version 2 uses an extended CoNLL-U format. See more in the readme. The corpus is distributed under the Creative Commons Attribution-ShareAlike 3.0 Unported license.
Gå till källa för data
Öppnas i en ny tabbhttps://doi.org/10.23695/SE5F-D274
Citering och åtkomst
Citering och åtkomst
Skapare/primärforskare:
- Östling, Robert
- Sjons, Johan
- Bjerva, Johannes
- Berdicevskis, Aleksandrs
Forskningshuvudman:
Citering:
Licens:
- Creative Commons Erkännande 4.0 Internationell (CC BY 4.0)Öppnas i en ny tabb
- Creative Commons Erkännande 4.0 Internationell (CC BY 4.0)Öppnas i en ny tabb
- Creative Commons Erkännande 4.0 Internationell (CC BY 4.0)Öppnas i en ny tabb
- Creative Commons Erkännande 4.0 Internationell (CC BY 4.0)Öppnas i en ny tabb
Språk:
Administrativ information
Administrativ information
slug:
sic2
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Nyckelord:
- Language Technology (Computational Linguistics)
- corpus
Metadata
Metadata
