Skip to main content
Researchdata.se

Digital audio

Not all pages will be translated when Researchdata.se is launched, but translations will follow.

En digital ljudfil som är tänkt att bevaras bör helst kodas och lagras i ett okomprimerat filformat för att säkerställa så hög kvalitet på ljudet som möjligt.  

Här räknar vi upp ett antal filformat, men det kan förekomma många andra format. Kontakta ditt lokala forskningsdatastöd för att få råd om vilka filformat som är lämpliga för långtidsbevarande och delning av den typ av forskningsdata du arbetar med. 

Tänk också på vilka rättigheter som gäller för formatet, framförallt vid intervjusituationer individens integritet kan vara skyddat av olika lagar. Läs mer till exempel på SND:s sida om GDPR och personuppgifterOpens in a new tab.

Viktiga egenskaper 

Okomprimerade ljudfiler är ofta väldigt stora, och det kan därför bli aktuellt att komprimera filer. För att bevara så hög kvalitet som möjligt är det viktigt att använda en förlustfri (lossless) komprimerande kodek.  

Om det finns behov av att konvertera en fil från ett format till ett annat är det flera viktiga egenskaper hos ljudfilen som man behöver känna till för att minimera risken för informationsförlust. Det är också viktigt att det finns tekniska metadata som beskriver datafilen. 

  • Varaktighet är längden på ljudfilen i tidskodat teckenformat (Timecoded Character Format, TCF).  
  • Bilddjup (Bit Depth) anger hur många bitar information som lagras per prov (sample) och är en indikator på ljudkvalitet (t.ex. 16 eller 24 bitar).
  • Samplingsfrekvens (Sample Rate) är en indikator för antalet samplingar per sekund. Samplingsfrekvens är oftast uttryckt i hertz, till exempel 44,1 kHz (en vanlig samplingsfrekvens) och är, liksom bilddjup, en indikator på kvaliteten på filen.
  • Kanaler beskriver antalet överföringskanaler som används för att bära fram ljudet till högtalaren: Mono (en kanal), Stereo (två kanaler) eller Surround (fler än två kanaler, ofta 5,1 eller 5,2). Om varje kanal har tilldelats ett kanalnummer kan dataskaparen välja varifrån ljudet som hör till olika kanaler ska komma, så kallad kanaltilldelning. I en stereoinspelning av en intervju kan man till exempel bestämma att ljudspåret med intervjuaren tilldelas kanal 1 och hörs i vänster högtalare och ljudspåret med personen som blir intervjuad tilldelas kanal 2 och hörs i höger högtalare. 

Vad ska bevaras? 

Ursprungsfilerna bör bevaras i obearbetat skick men även den slutliga produkten, det vill säga den färdigbearbetade ljudfilen, bör bevaras. Anledningen till att både ursprungsfilerna och den bearbetade, färdiga ljudfilen ska bevaras är att den senare sannolikt saknar ljuddata som finns i ursprungsfilen. 

Det är också viktigt att bevara metadata och dokumentation av hur filen har skapats och bearbetats, till exempel inspelningsplats, datum och personer som deltagit. Metadata kan vara inbäddade i filen eller sparas separat. 

Föreslagna filformat för delning 

Eftersom många av de vanligaste filformaten för ljudinspelning är vanliga och har brett stöd är det sällan nödvändigt att konvertera inspelade material till ett annat format, men det kan vara värt att fundera över hur filerna bäst ska långtidsbevaras. 

  • Waveform Audio (.wav)
  • Broadcast Wave Format (.bwf)
  • Audio Interchange File Format (.aif, .aiff)
  • Free Lossless Audio Codec (.flac)
  • Matroska (.mka)
  • MPEG-1, MPEG-2 (.mpg, .mpeg, …) 

MPEG-1 Audio Layer III (.mp3), Advanced Audio Coding (.aac) och Ogg Vorbis (.ogg) är filformat som använder destruktiv (lossy) komprimering, som du om möjligt bör undvika när du skapar ljudfiler. I de fall forskningsmaterialet ursprungligen skapats i dessa format kan filerna delas och enkelt återanvändas av andra forskare.  

Apple Lossless Audio Codec (ALAC) möjliggör förlustfri komprimering men har bara stöd finns bara för Apple-enheter och bör därför undvikas för delning och långtidsbevarande.