Skip to main content
Researchdata.se

Spatial data

Not all pages will be translated when Researchdata.se is launched, but translations will follow.

Spatiala data beskriver objekt, områden eller fenomen som har spatiala eller rumsliga egenskaper, exempelvis position, storlek eller form. Spatiala data omfattar information med geografiska särdrag, som var på jorden en viss sjö ligger och hur stor och djup sjön är, eller hur många personer som bor inom ett visst postnummer.  

Geografiska informationssystem (GIS) är ett sätt att strukturera spatiala data som geografiska element kopplade till attributdata. Geografiska element kan delas in i vektorelement (baserade på punkter, linjer eller polygoner) eller rasterelement (baserade på ett rutnät). 

Alla spatiala data är inte GIS-data. En Exceltabell med kolumner för postnummer och antal invånare är inte GIS-data, men blir de om den importeras i ett GIS-program och kopplas till geografiska element som beskriver postnummergränser eller mittpunkter. Omvänt är data inom Building Information Modeling (BIM), som beskriver byggnader och infrastruktur, i grunden spatiala data men kan även representera generiska strukturer utan fast geografisk förankring.

Här räknar vi upp ett antal filformat, men det kan förekomma många andra format. Kontakta ditt lokala forskningsdatastöd för att få råd om vilka filformat som är lämpliga för långtidsbevarande och delning av den typ av forskningsdata du arbetar med.

Raster- och vektorformat

Mer utförlig information om raster- och vektorformat finns på sidan Bilder.

Rasterdata  

GIS-data i rasterformat används för att representera hur en modellerad eller uppmätt egenskap (t.ex. höjd, temperatur eller vegetationsfraktion) varierar geografiskt. Ett exempel på sådana rasterdata är kartan som används för att visa sökresultatens rumsliga placering i forskningsdatakatalogen på Researchdata.seOpens in a new tab.

Bild på värmekartan i forskningsdatakatalogen på Researchdata.se
En så kallad värmekarta, där den röd-gula färgen indikerar platser som har närliggande dataset i forskningsdatakatalogen på Researchdata.se.

Vektordata

GIS-data som används för att skapa exempelvis topografiska kartor sparas vanligtvis i vektorformat. Antalet kolumner i en attributtabell kan variera och informationen i kolumnerna kan skilja sig åt.

Bildtext: En GIS-datafil över Sveriges kommuner.
Bildtext: En GIS-datafil över Sveriges kommuner. Kommuners gränser lagras som polygoner och attributtabellen har kolumnerna ”KnKod” samt ”KnNamn”.  

Datahantering för GIS-data

GIS-data är ofta uppdelade i flera filer där varje fil har sin funktion, till exempel en fil som innehåller en attributtabell, en fil med objektets geometri, en fil med information om koordinatsystem och en fil med metadata. Om man flyttar GIS-data från en mapp till en annan är det därför viktigt att kontrollera att alla filer följer med. 

Bild som visar ett vektorobjekt som är uppdelat i flera olika filer.
GIS-data lagrade i flera olika filer. Vi vet att de hör ihop genom att samtliga filer i exemplet heter "vector_point". Vill vi flytta data så måste vi se till att samtliga filer följer med, annars går information förlorad.

GIS-data som ligger till grund för forskningsresultat är ofta resultatet av en bearbetningsprocess i flera steg, med operationer som reducerar och kombinerar data från olika dataset. För att en sekundäranvändare ska förstå datasetet och hur det togs fram är det viktigt att dokumentera alla steg i bearbetningskedjan.    

Geografiska koordinatreferenssystem och kartprojektioner

Ett referenssystem är en systematisk metod för att med siffror/koordinater beskriva var på jorden något är beläget. World Geodetic System 1984 (WGS84)Opens in a new tab är ett vanligt förekommande referenssystem för GIS-dataset som används i bland annat det globala positioneringssystemet GPS.

För regionala kartor används vanligen en kartprojektion som gör att avstånd, områden och riktningar kan tolkas mer enhetligt över en karta. Inom Sverige används det projekterade koordinatreferenssystemet SWEREF 99 TMOpens in a new tab, där position anges som en nordlig riktning (N) med sju siffror och en östlig riktning (E) med (vanligtvis) sex siffror, båda med enheten meter.

Det bästa sättet att beskriva det referenssystem och den kartprojektion som används i ett GIS-dataset är att lägga till en EPSG-kod från EPSG Geodetic Parameter DatasetOpens in a new tab. Stöd för detta finns i de flesta GIS-program.  

Tillgänglighetsnivå

Data som utgör början på en GIS-bearbetningskedja är ofta hämtade från befintliga, i många fall offentliga, dataset. Dessa behöver inte infogas i det dataset som ska delas, men det måste finnas en tydlig källhänvisning till de ursprungliga dataseten.

Viss GIS-bearbetning innebär att man väljer ut och eventuellt modifierar element från befintliga GIS-dataset. Till exempel kan en framtida stadsstudie utgå från befintliga urbana GIS-data för vägar och parker. I sådana studier kommer troligen några av elementen från källdataseten att finnas med i slutprodukten. I den framtida stadsstudien kan till exempel data för de större vägarna komma att behållas. I sådana fall är det viktigt att kontrollera vad du har för rättigheter att distribuera kopior av källdatasetet, exempelvis vad det har för licens. I Sverige används till exempel ofta öppna data från Lantmäteriet för att skapa kartor och figurer, men i många fall får källdata inte delas öppet på nytt.  

Om GIS-data innehåller känslig eller upphovsrättsskyddad information kan tillgängligheten behöva begränsas. GIS-data som innehåller personuppgifter (t.ex. platsinformation för undersökningsrespondenterna) ska skyddas. Information som rör statens säkerhet (t.ex. om infrastruktur eller militära skyddsobjekt) skyddas oftast av stark sekretess och detsamma gäller platsinformationen för vissa hotade arters habitat. 

Föreslagna filformat för delning och långtidsbevarande

Det finns många filformat som används för GIS-data. Öppna filformat är att föredra för delning och ett populärt öppet format är GeoPackage, som paketerar både vektor- och rasterdata i en fil. Några vanliga format för enklare vektordata är ESRI Shapefile, GeoJSON och KML. För rena rasterdata är den öppna standarden GeoTIFF populär, men DEM och ESRI Grid är också vanliga. MapInfo Interchange Format är ett proprietärt format men har brett stöd och kan lätt återanvändas för vidare forskning.

Föreslagna filformat för delning

  • OGC GeoPackage (.gpkg)  
  • ESRI Shapefile (.shp)  
  • GeoJSON (.geojson)  
  • Keyhole Markup Language (.kml)  
  • GeoTIFF (.tif, .tiff)  
  • ESRI GRID (.adf, .asc, .grd)  
  • Digital Elevation Model (DEM) Format (.dem)  
  • Geographic Markup Language (.gml)  
  • NetCDF (.nc)  
  • MapInfo (.tab, .dat)  
  • MapInfo Interchange Format (.mif, .mid)  
  • CSV (.csv)  

Föreslagna filformat för långtidsbevarande i arkiv eller liknande:

  • OGC GeoPackage (.gpkg)  
  • ESRI Shapefile (.shp)  
  • GeoJSON (.geojson)  
  • Keyhole Markup Language (.kml)  
  • GeoTIFF (.tif, .tiff)  
  • Digital Elevation Model (DEM) Format (.dem)  
  • NetCDF (.nc)  
  • CSV (.csv)