Gå direkt till huvudinnehåll
Researchdata.se

Återanvända och citera data

Du kan återanvända forskningsdata för att komplettera egna resultat, utforska nya forskningsfrågor eller analysera data från flera källor. När du återanvänder forskningsdata är det viktigt att kontrollera att du får använda dem och att du hänvisar till upphovspersonerna bakom de data du använder.

Vad innebär återanvändning av forskningsdata?

Att återanvända forskningsdata innebär att använda data som skapats eller samlats in av andra forskare till ny forskning. Genom att återanvända befintliga data kan du:

  • bygga vidare på tidigare forskning
  • nå nya insikter genom metaanalyser där data från olika studier syntetiseras för att dra bredare slutsatser
  • få referensdata till din forskning, till exempel för kalibreringar och för att verifiera fjärranalysdata
  • undvika onödiga experiment och kostnader
  • göra din forskning mer robust genom att aggregera resultat från olika metoder eller prover
  • minska belastningen på överbeforskade populationer.

Ett annat viktigt område för befintliga forskningsdata är replikeringsstudier. De återskapar tidigare analyser med hjälp av tillgängliga dataset för att verifiera att rapporterade resultat är korrekta. Replikering av forskningsresultat utgör en grundbult inom öppen vetenskap och är avgörande för att säkerställa att forskningen är tillförlitlig.

Vad ska jag tänka på innan jag återanvänder forskningsdata?

Du har hittat forskningsdata som är relevanta för din forskning och hur du kan få tillgång till dem. Innan du använder dem finns det några saker som kan vara bra att tänka på, så att du inte senare riskerar att behöva förkasta arbete du gjort med data. 

Kontrollera användarvillkoren

Kontrollera vad de data du vill använda har för licens eller användarvillkor för att se till att du får använda data så som du tänkt göra. Forskningsdata som delas via repositorier eller webbplatser får vanligtvis återanvändas i ny forskning även om de saknar licens.

Var noga med att dokumentera licenser eller användarvillkor för alla data du återanvänder. Om du kombinerar data med olika licenser skulle du kunna få dataset med inbördes motstridiga licensvillkor. Men om du då kan visa licenserna för de data du använt och att du har följt licensernas användarvillkor bör du kunna dela dina dataset utan att bryta mot några licensvillkor.

Du kan läsa mer om licenser på sidan Licenser.

Forskning som omfattar personuppgifter ställer ytterligare krav på dig som forskare, oavsett om det är du eller någon annan som har samlat in data. När du återanvänder data med personuppgifter gäller i allmänhet samma regler som vid den ursprungliga forskningen på materialet. Om de forskningsdata du har tänkt återanvända innehåller känsliga personuppgifter behöver du dessutom ansöka om etikprövning och få ett godkännande innan du samlar in data.

Läs mer om detta på SND:s sidor om forskningsjuridikÖppnas i en ny tabb och i SND:s handbok för data med personuppgifterÖppnas i en ny tabb.

Kan du lita på datakällan?

Det är viktigt att bedöma om data är tillförlitliga innan du använder dem. Du kan till exempel ställa följande frågor för att avgöra om forskningsdata du vill återanvända kommer från en trovärdig källa:

  • Finns det en tydligt angiven källa?
  • Förvaras data hos en tillförlitlig myndighet, organisation eller i ett certifierat repositorium?
  • Används data av många forskare?
  • Har data granskats eller kurerats?
  • Följer data etablerade standarder?
  • Kommer data från ett dataset med en beständig identifierare (t.ex. en DOI)?
  • Finns det kontaktuppgifter om du har frågor om datamaterialet?

Bedöm datas kvalitet och relevans

En av de största utmaningarna vid återanvändning av forskningsdata är att avgöra om data är relevanta för det tänkta syftet och om de håller tillräckligt hög kvalitet. Vissa datatyper, som genomdata, är relativt enkla att återanvända. För andra datatyper, till exempel data från genuttrycksexperiment, kan du behöva ha tillgång till detaljerade metadata och kontextuell information om hur data har genererats för att kunna tolka och återanvända dem korrekt.

Du bör kunna hitta följande information om data i datasetets metadata eller från en tillhörande forskningspublikation:

  • varför data samlades in/genererades
  • vem som samlade in/genererade data
  • hur och när data samlades in/genererades
  • hur data bearbetades
  • hur kvalitetskontrollen av data sett ut.

Med hjälp av den informationen bör du kunna avgöra om de data du hittat passar dina behov.

Citera forskningsdata

En grundläggande princip inom god forskningssed är att ange källor till all information du använder i din forskning. Detta gäller även vid återanvändning av forskningsdata. Genom att citera de data du använder hänvisar du till källan och ger uppmärksamhet och erkännande till upphovspersonernas forskning. Citeringar bidrar även till forskningens reproducerbarhet genom att det gör det lättare att hitta och få tillgång till de data som används i studier. 

När du citerar ett dataset rekommenderar vi att du även citerar de eventuella originalartiklar där datasetet beskrivs. På så sätt ger du författarna erkännande som upphovspersoner och lämnar en viktig länk till information om hur data samlades in eller skapades. Licenser och användarvillkoren har ofta som krav att du ger erkännande till författare eller upphovspersoner och anger datakällan på ett korrekt sätt.

Citera data i akademiska artiklar

Citeringar till återanvända data bör finnas med i artikelns referenslista. Data brukar citeras i data- eller metod-avsnitten i huvudmanuskriptet och i artikelns redogörelse för datatillgänglighet, Data Availability Statement. Du bör ange alla datakällor och under vilka licenser eller användningsvillkor du återanvänder data. När du använder nedladdade dataset (t.ex. filer från Researchdata.se eller Zenodo.org) räcker det att citera datasetet för att identifiera resursen; du behöver inte ange länkar till enskilda filer i datasetet. Om du bara har använt enstaka filer eller variabler ur ett dataset som innehåller stora mängder data kan du förklara det i ditt Data Availability Statement.

Datacitering och referenslista

De flesta tidskrifter vill att man citerar data på samma sätt som forskningsartiklar. Kontrollera alltid vad tidskriften har för önskemål om referens- eller citeringsformat och om det finns några särskilda instruktioner för citering av data. En typisk citering av ett dataset i APA-format kan se ut så här:

Selfridge, A. R., Spencer, B., Shiyam Sundar, L. K., Abdelhafez, Y., Nardo, L., Cherry, S. R., & Badawi, R. D. (2023). Low-Dose CT Images of Healthy Cohort (Healthy-Total-Body-CTs) (Version 2) [Dataset]. The Cancer Imaging Archive. https://doi.org/10.7937/NC7Z-4F76Öppnas i en ny tabb

När forskningsdata hämtas från källor online finns det ofta ett förslag till citering på webbsidan, som vanligtvis är formaterat på samma sätt som en referens i en bibliografi. Kopiera den föreslagna citeringen eller lägg in informationen i det referenshanteringsverktyg du använder.

Det är vanligt att dataset har en DOI (Digital Object Identifier), en beständig identifierare som är ett alternativ till att skapa citeringar. Du kan skapa en bibliografisk post för ett dataset genom att lägga in DOI:en i en DOI-citeringsformaterare, till exempel DOI Citation FormatterÖppnas i en ny tabb eller BibGuruÖppnas i en ny tabb. Om du använder ett referenshanteringsprogram (t.ex. EndNote, Mendeley, Zotero eller Paperpile) kan du använda motsvarande webbläsartillägg (Capture EndNote Reference, Mendeley Web Importer, Zotero Connector eller Paperpile-tillägget) för att importera referensinformationen för ett dataset med en DOI. Precis som du skulle göra med en vetenskaplig artikel går du till datasetets landningssida och kör tillägget. Kontrollera alltid att den importerade informationen är korrekt innan du använder den.

Citera data utan DOI

Om ett dataset saknar DOI kan det finnas en rekommendation om hur datasetet ska citeras på den sida där du hittade det. Om det inte finns någon rekommenderad citering kan du citera datasetet på samma sätt som en webbsida. Detta är dock det minst tillförlitliga sättet att citera ett dataset eftersom informationen på en webbsida kan ändras och andra forskare som besöker samma sida kan formatera sina citeringar på ett annat sätt.

När det gäller opublicerade data kan du inte ange något publiceringsdatum eller en utgivare. Men om du enbart anger namnet på personen som delade data med dig är det inte troligt att någon sekundäranvändare kommer kunna hitta resursen. För att det ska finnas något sätt att verifiera data bör du i så fall ange den organisation som datasetets upphovsperson tillhör som utgivare i referenslistan.