Gå direkt till huvudinnehåll
Researchdata.se

Filformat

Alla digitala filformat riskerar att bli föråldrade och falla ur bruk. Om det händer skulle värdefulla forskningsdata kunna gå förlorade för att de inte längre kan läsas och användas. Därför är det viktigt att välja filformat som med stor sannolikhet går att använda även i framtiden.

När du väljer filformat ska du välja ett eller flera format som gör det möjligt att återanvända projektets data, på både kort och lång sikt. I allmänhet gäller att de format som är lämpligast för tillgängliggörande och långtidsbevarande är vanligt förekommande, väldokumenterade och öppna, det vill säga att formatet:

  • baseras på en öppen standard
  • är oberoende av plattform/en specifik programvara
  • är öppet dokumenterat och
  • underhålls av en oberoende organisation.

Motsatsen till öppna filformat är proprietära filformat, som i regel bara kan öppnas i de program som har utvecklats av den som äger och bestämmer över formatet. Om du främst arbetar i proprietära program och format kan det lämpligaste vara att göra data tillgängliga i det format som är standard inom din disciplin men också bifoga data i ett format som är mer lämpligt för att bevara dem på lång sikt och göra dem tillgängliga utanför ditt forskningsområde.

Det viktigaste är att de filer du sparar vid forskningsprojektets slut ska kunna öppnas igen i framtiden. Om du använder dig av öppna, väldokumenterade format är chansen störst att det går att läsa och använda filerna även om programmet du använt i forskningen inte längre fungerar.

Om du arbetar i ett proprietärt format och skapar filer som du senare konverterar inför tillgängliggörande och långtidsbevarande, tänk då på att det kan vara bra att spara data både i det format du arbetar i och samtidigt i ett öppet format som är mer lämpligt för delning och arkivering.

När du konverterar filer till nya format är det med andra ord viktigt att originalfilerna bevaras, för att undvika den informationsförlust som kan uppstå om de öppna filformat som rekommenderas inte kan hantera all information som finns i de proprietära formaten. Läs mer om vad du bör tänka på vid konvertering på sidan Komprimering av ljud, bild och video.

Filformat för olika typer av data

På de här sidorna får du rekommendationer om filformat som är lämpliga för delning och tillgängliggörande av data och för långtidsbevarande i arkiv. Listorna uppdateras löpande och är inte fullständiga listor över filformat. Om du vill ha råd om lämpliga filformat för långtidsbevarande kan du kontakta det lokala forskningsdatastödetÖppnas i en ny tabb.

FormatE

Riksarkivet arbetar med att ta fram nationella riktlinjer för beständiga elektroniska handlingar i ett projekt som går under namnet FormatE. 

Läs mer om FormatE hos RiksarkivetÖppnas i en ny tabb

Arbetsfiler

Det är inte ovanligt att forskare arbetar i format som är standard inom ett givet forskningsfält, men som är mindre använt utanför det. Du ska givetvis välja ett filformat som passar för din datainsamling och tänkta analysmetod, men det är värt att i förväg ta reda på om filformatet också är lämpligt för att tillgängliggöra och bevara data. Det är värdefullt att de som vill återanvända data kan öppna filerna även om de inte har tillgång till de specifika program du själv arbetat med.

Om det inte redan från början av forskningsarbetet är möjligt att välja ett filformat som lämpar sig för tillgängliggörande och långtidsbevarande kan ett alternativ vara att konvertera de filer som ska bevaras till ett format som är mer lämpligt för att långtidsbevara data. Ange då i projektdokumentationen, till exempel datahanteringsplanen, vilka format du valt och för vilka syften, till exempel för att arbeta med data eller för att dela data. Kom ihåg att alltid spara originalfilerna för att säkerställa att ingen information går förlorad.

Vissa datakällor (maskiner, skannrar, drönare med mera) innehåller programvara som gör att data enbart kan sparas i analysprogrammets egna format. Det kan innebära att data inte blir tillgängliga och användbara på längre sikt. Du bör med andra ord använda programmen endast för sådana data som måste behandlas på det viset. I sådana fall är det bra att följa mantrat ”Bättre att dela det som finns än att inte dela alls”. Det är ibland också möjligt att dela det proprietära dataformatet tillsammans med filer i öppna format som innehåller det datainnehåll som det är möjligt att extrahera till ett öppet format. Dokumentera både vilket program du har använt för insamling och analys och vilken version av programmet. 

Om du skriver ett eget analysprogram bör du tänka på att programmet ska kunna spara data i ett format som kan läsas även utan programmet (exempelvis ett XML-baserat format). Om det inte är möjligt att göra så ska det åtminstone gå att exportera data till ett annat filformat, även om det skulle innebära att viss information går förlorad. Tänk som sagt på att alltid spara och tillgängliggöra originalfilerna för att undvika risken att information försvinner.