PGV-PII
https://doi.org/10.23695/QCQG-3613
Det här är en liten korpus som består av 10 par texter på svenska och engelska, annoterade med kategorier av personliga uppgifter. Annoteringen liknar den av TAB-korpusen (https://aclanthology.org/2022.cl-4.19Öppnas i en ny tabb). De tjugo texterna har sitt ursprung i Parallel Global Voices-korpusen (https://nlp.ilsp.gr/pgvÖppnas i en ny tabb, CC BY 4.0) och var annoterade för hand. Denna korpus innehåller data från Global Voices-webbsidorna (https://globalvoices.orgÖppnas i en ny tabb, CC BY 3.0).
Gå till källa för data
Öppnas i en ny tabbhttps://doi.org/10.23695/QCQG-3613
Citering och åtkomst
Citering och åtkomst
Skapare/primärforskare:
- Szawerna, Maria Irena
- Suchardt, Jacob Lee
Forskningshuvudman:
Citering:
Administrativ information
Administrativ information
slug:
pgv-pii
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Nyckelord:
- Language Technology (Computational Linguistics)
- pseudonymization
- anonymization
- parallel
- news
- corpus
Metadata
Metadata
