Gå direkt till huvudinnehåll
Researchdata.se

Metoder för kvantitativa data

Det finns många olika sätt att pseudonymisera kvantitativa data. Det är alltid upp till dig som forskare att bedöma vilka metoder som passar dina forskningsdata bäst. Här tar vi upp några allmänna tips och vanligt förekommande metoder för att pseudonymisera kvantitativa data.

10 tips för kvantitativa data

1. Använd ett statistikprogram med skriptfunktion
2. Arbeta aldrig direkt i originaldata
3. Börja med direkta och indirekta identifierare
4. Tabulera och visualisera
5. Gå alltid igenom eventuella fritextsvar
6. Var konsekvent
7. Gå igenom bakgrundsmaterial
8. Utvärdera
9. Gör en kodbok
10. Samla inte in personuppgifter i onödan

Vanliga metoder

Det vanligaste sättet att pseudonymisera kvantitativa data är att använda olika statistiska metoder. Statistiska metoder fokuserar på åtgärder som direkt rör din datamängd. Dessa metoder innebär att du ändrar datamängdens innehåll på ett sätt som gör det svårt eller omöjligt för någon att avslöja en forskningspersons identitet. Statistiska metoder kan lite förenklat delas in i två kategorier:

  • Generalisering: Den här typen av metoder innebär att du minskar detaljrikedomen i dina data på ett sätt som gör det svårt eller omöjligt att urskilja en enskild person. Det vanligaste sättet är att koda om variabler och skapa breda kategorier som gör informationen i dina data mindre specifik. Ett vanligt exempel på generalisering är att skapa åldersintervall baserat på specifika åldrar eller födelsedatum.
  • Randomisering: Den här typen av metoder byter slumpmässigt ut värden i dina forskningsdata, vilket gör det svårt eller omöjligt att identifiera en enskild individ. Vanligtvis handlar det om att byta ut värden på indirekta identifierare i datamängden. De får aningen ett helt slumpmässigt värde eller byts ut mot värden i en annan observation i datamängden.

Metoder som använder generalisering

1. Radera direkta identifierare
2. Koda om variabelvärden
3. Redigera, koda eller radera fritextsvar
4. K-anonymitet och andra sätt att räkna på risk

Metoder som använder randomisering

1. Brustillägg
2. Permutation
3. Differentiell integritet

Vill du veta mer?

Informationen på denna sida bygger på flera olika källor som ger en fördjupad genomgång av metoder som du som forskare kan använda vid hantering av kvantitativa data. Länkarna nedan vänder sig till dig som vill fördjupa dig ytterligare och ta del av mer information.

  • Data Management Guidelines. Finnish Social Science Data Archive, Tampere. LänkÖppnas i en ny tabb
  • Research Data Management Support et al. (2025). Data Privacy Handbook (v2025.05.06). Zenodo. LänkÖppnas i en ny tabb
  • Artikel 29-arbetsgruppen (2014). Yttrande 05/2014 om anonymiseringstekniker. LänkÖppnas i en ny tabb
  • Europeiska kommissionen (2021). Ethics and data protection. LänkÖppnas i en ny tabb
  • Taylor, L., Zhou, X.-H. & Rise, P. (2018). A tutorial in assessing disclosure risk in microdata. Statistics in Medicine, 37(25), 3693–3706. LänkÖppnas i en ny tabb
  • El Emam, K. & Dankar, F. K. (2008). Protecting privacy using k-anonymity. Journal of the American Medical Informatics Association, 15(5), 627–637. LänkÖppnas i en ny tabb