<codeBook xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="ddi:codebook:2_5 http://www.ddialliance.org/Specification/DDI-Codebook/2.5/XMLSchema/codebook.xsd" xmlns="ddi:codebook:2_5">
  <docDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Data för Improving Stream Network Accuracy with Deep Learning-Enhanced Detection of Road Culverts in High-Resolution Digital Elevation Models</titl>
        <parTitl xml:lang="en">Data for Improving Stream Network Accuracy with Deep Learning-Enhanced Detection of Road Culverts in High-Resolution Digital Elevation Models</parTitl>
        <IDNo agency="SND">2024-140-1</IDNo>
        <IDNo agency="slu.se">SLU.seksko.2025.4.2.IÄ-2</IDNo>
        <IDNo agency="DOI">https://doi.org/10.5878/rjpg-ec44</IDNo>
      </titlStmt>
      <prodStmt>
        <producer xml:lang="en" abbr="SND">Swedish National Data Service</producer>
        <producer xml:lang="sv" abbr="SND">Svensk nationell datatjänst</producer>
      </prodStmt>
      <holdings URI="https://doi.org/10.5878/rjpg-ec44">Landing page</holdings>
    </citation>
  </docDscr>
  <stdyDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Data för Improving Stream Network Accuracy with Deep Learning-Enhanced Detection of Road Culverts in High-Resolution Digital Elevation Models</titl>
        <parTitl xml:lang="en">Data for Improving Stream Network Accuracy with Deep Learning-Enhanced Detection of Road Culverts in High-Resolution Digital Elevation Models</parTitl>
        <IDNo agency="SND">2024-140-1</IDNo>
        <IDNo agency="slu.se">SLU.seksko.2025.4.2.IÄ-2</IDNo>
        <IDNo agency="DOI">https://doi.org/10.5878/rjpg-ec44</IDNo>
        <IDNo agency="DOI">10.1016/j.ejrh.2024.102148</IDNo>
      </titlStmt>
      <rspStmt>
        <AuthEnty xml:lang="en" affiliation="Department of Forest Ecology and Management, Swedish University of Agricultural Sciences">Lidberg, William</AuthEnty>
        <AuthEnty xml:lang="sv" affiliation="Institutionen för skogens ekologi och skötsel, Sveriges lantbruksuniversitet">Lidberg, William</AuthEnty>
      </rspStmt>
      <prodStmt />
      <distStmt>
        <distrbtr xml:lang="en" abbr="SND" URI="https://snd.se">Swedish National Data Service</distrbtr>
        <distrbtr xml:lang="sv" abbr="SND" URI="https://snd.se">Svensk nationell datatjänst</distrbtr>
        <distDate xml:lang="en" date="2025-02-25" />
      </distStmt>
      <verStmt>
        <version elementVersion="1" elementVersionDate="2025-02-25" />
      </verStmt>
      <holdings URI="https://doi.org/10.5878/rjpg-ec44">Landing page</holdings>
    </citation>
    <stdyInfo>
      <subject>
        <keyword xml:lang="en" vocab="GCMD" vocabURI="https://gcmd.nasa.gov/kms/concept/d4313915-2d24-424c-a171-30ee9a6f4bb5">INFRASTRUCTURE</keyword>
        <keyword xml:lang="en" vocab="GCMD" vocabURI="https://gcmd.nasa.gov/kms/concept/5e3c573f-a787-4afa-80a4-047c2c5d83f2">RIVERS/STREAMS</keyword>
        <keyword xml:lang="en" vocab="GEMET" vocabURI="http://www.eionet.europa.eu/gemet/concept/1015">brook</keyword>
        <keyword xml:lang="sv" vocab="GEMET" vocabURI="http://www.eionet.europa.eu/gemet/concept/1015">bäck</keyword>
        <keyword xml:lang="en" vocab="GEMET" vocabURI="http://www.eionet.europa.eu/gemet/concept/4321">infrastructure</keyword>
        <keyword xml:lang="sv" vocab="GEMET" vocabURI="http://www.eionet.europa.eu/gemet/concept/4321">infrastruktur</keyword>
        <keyword xml:lang="en" vocab="GEMET" vocabURI="http://www.eionet.europa.eu/gemet/concept/9161">watercourse</keyword>
        <keyword xml:lang="sv" vocab="GEMET" vocabURI="http://www.eionet.europa.eu/gemet/concept/9161">vattendrag</keyword>
        <keyword xml:lang="en" vocab="EnvThes" vocabURI="http://vocabs.lter-europe.net/EnvThes/10195">infrastructure</keyword>
        <keyword xml:lang="sv" vocab="EnvThes" vocabURI="http://vocabs.lter-europe.net/EnvThes/10195">infrastruktur</keyword>
        <keyword xml:lang="en" vocab="INSPIRE Spatial Data Themes" vocabURI="http://inspire.ec.europa.eu/theme/tn">Transport networks</keyword>
        <keyword xml:lang="sv" vocab="INSPIRE Spatial Data Themes" vocabURI="http://inspire.ec.europa.eu/theme/tn">Transportnät</keyword>
        <keyword xml:lang="en" vocab="AGROVOC" vocabURI="http://aims.fao.org/aos/agrovoc/c_49834">machine learning</keyword>
        <keyword xml:lang="sv" vocab="AGROVOC" vocabURI="http://aims.fao.org/aos/agrovoc/c_49834">maskininlärning</keyword>
        <keyword xml:lang="en" vocab="AGROVOC" vocabURI="http://aims.fao.org/aos/agrovoc/c_c3ea7f1d">LIDAR</keyword>
        <topcClas xml:lang="en" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/planningCadastre">Planning / Cadastre</topcClas>
        <topcClas xml:lang="sv" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/planningCadastre">Fastigheter och fysisk planering</topcClas>
        <topcClas xml:lang="en" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/geoscientificInformation">Geoscientific Information</topcClas>
        <topcClas xml:lang="sv" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/geoscientificInformation">Geovetenskap</topcClas>
        <topcClas xml:lang="en" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/environment">Environment</topcClas>
        <topcClas xml:lang="sv" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/environment">Miljö</topcClas>
        <topcClas xml:lang="en" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/transportation">Transportation</topcClas>
        <topcClas xml:lang="sv" vocab="INSPIRE topic categories" vocabURI="http://inspire.ec.europa.eu/metadata-codelist/TopicCategory/transportation">Transporter</topcClas>
      </subject>
      <abstract xml:lang="en" contentType="abstract">This is the training and testing data used to train a Residual Attention UNet for segmentation and detection of road culverts. The data consists of pairs of images with the size 256x256 pixels where one image is a labeled mask and the other a image with four channels containing the remote sensing data. The remote sensing data is a combination of topographical data extracted from arial laser scanning and ortophotos from arial imagery.

An extensive culvert survey was conducted in 25 watersheds in central Sweden by the Swedish Forest Agency during the snow-free periods of 2014–2017.  A total of 24,083 culverts were mapped with a handheld GPS with a horizontal accuracy of 0.3 m.  Densely populated urban areas with underground drainage systems were excluded from the survey (0.3% of the combined area). The coordinates of both ends of each culvert were measured, and metrics such as diameter, length, material, working condition, and sediment accumulation were collected for most of the culverts. Additional metrics, such as the elevation difference between the outlet and stream water level, were manually measured with a ruler. The inventoried watersheds were split up into training and testing data, where 20 watersheds (23,304 culverts) were used for training, and five watersheds (5,208 culverts) were used for testing. 

A compact laser-based system (Leica ALS80-HP-8236) was used to collect the ALS data from an aircraft flying at 2888–3000 m. The ALS point clouds had a point density of 1–2 points m-2 and were divided into tiles with a size of 2.5 x 2.5 km each. A DEM with 0.5 m resolution was created from the ALS point clouds using a TIN gridding approach implemented in Whitebox tools 2.2.0. The topographical index max downslope elevation change was calculated from the DEM using Whitebox Tools . Max downslope elevation change represents the maximum elevation drop between each grid cell and its neighbouring cells within a DEM. This typically resulted in values between 0 and 10.

Orthophotos from aerial imagery captured at the same time as the lidar data is also included. The orthophotos had three bands (red, green and blue) in 8-bit color depth and had a resolution of 0.5 m. The LiDAR data and orthophotos were downloaded from the Swedish mapping, cadastral and land registration authority. 

The topographical data and the ortophotos were merged into 8-bit four band images where the first three band is red, green and blue, and the last band is max downslope elevation change. The merged images where then split into smaller tiles with the size 256x256 pixels. 

The trained model was used to predict culverts in Sweden and the file PredictedCulvertsByIsobasins.zip contains the predicted culverts stored as shapefiles split by the watersheds in the file "isobasins.zip".</abstract>
      <abstract xml:lang="sv" contentType="abstract">Detta är tränings- och testdata som används för att träna ett Residual Attention UNet för segmentering och detektion av vägtrummor. Data består av bildpar med storleken 256x256 pixlar där ena bilden är en binär mask och den andra en bild med fyra kanaler som innehåller fjärranalysdata. Fjärranalysdatan är en kombination av topografiska data extraherade från flygburen laserskanning och ortofoton från flygburen bildinsamling.

En omfattande undersökning av kulvertar genomfördes i 25 avrinningsområden i Gävleborgs län av Skogsstyrelsen under snöfria perioder 2014–2017. Totalt kartlades 24 083 vägtrummor med en handhållen GPS med en horisontell noggrannhet på 0,3 m. Tättbefolkade stadsområden med underjordiska avloppssystem exkluderades från undersökningen (0,3% av den sammanslagna ytan). Koordinaterna för båda ändar av varje trumma mättes in, och mått som diameter, längd, material, skick och sedimentansamling samlades in för de flesta kulvertarna. Ytterligare mått, som höjdskillnaden mellan utloppet och vattenståndet i strömmen, mättes manuellt i fält. De inventerade avrinningsområdena delades upp i tränings- och testdata, där 20 avrinningsområden (23 304 trummor) användes för träning, och fem avrinningsområden (5 208 trummor) användes för utvärdering.

Ett kompakt lasersystem (Leica ALS80-HP-8236) användes för att samla in data från ett flygplan som flög på 2888–3000 m höjd. Punktmolnen hade en punkttäthet på 1–2 punkter m^-2 och delades in i rutor med en storlek på 2,5 x 2,5 km vardera. En DEM med 0,5 m upplösning skapades från ALS-punktmolnen med en TIN-rutnätsmetod implementerad i Whitebox tools 2.2.0. Topografisk index för maximal höjdskillnad med omgivande pixlar beräknades från höjdmodellen med hjälp av Whitebox Tools. 

Ortofoton från flygplan som togs vid samma tidpunkt som LiDAR-data ingår också. Ortofotona hade tre band (rött, grönt och blått) i 8-bitars färgdjup och hade en upplösning av 0,5 m. Topografiska data och ortofoton laddades ner från Lantmäteriet.

Topografiska data och ortofoton slogs samman till 8-bitars fyra band-bilder där de första tre banden är rött, grönt och blått, och det sista bandet är det topografiska datat. De sammanslagna bilderna delades sedan upp i mindre bitar med storleken 256x256 pixlar.

Den tränade modellen användes för att prediktera vägtrummor på nationell skala och resultatet är i mappen  PredictedCulvertsByIsobasins.zip där de predikterade trummorna sparats som shapefiler uppdelade efter avrinningsområden som finns i filen "isobasins.zip".</abstract>
      <sumDscr>
        <nation xml:lang="en" abbr="SE">Sweden</nation>
        <nation xml:lang="sv" abbr="SE">Sverige</nation>
        <dataKind xml:lang="en">Still image</dataKind>
        <dataKind xml:lang="en">Geospatial</dataKind>
        <dataKind xml:lang="en">Software</dataKind>
      </sumDscr>
    </stdyInfo>
    <method>
      <dataColl />
    </method>
    <dataAccs>
      <useStmt>
        <restrctn xml:lang="en">Access to data through SND. Data are freely accessible.</restrctn>
        <restrctn xml:lang="sv">Åtkomst till data via SND. Data är fritt tillgängliga.</restrctn>
        <conditions elementVersion="info:eu-repo-Access-Terms vocabulary">openAccess</conditions>
      </useStmt>
    </dataAccs>
    <othrStdyMat>
      <relPubl>
        <citation>
          <titlStmt>
            <titl xml:lang="sv">Lidberg W. 2025. Deep learning-enhanced detection of road culverts in high-resolution digital elevation models: Improving stream network accuracy in Sweden. Journal of Hydrology: Regional Studies. V 57, 102148. https://doi.org/10.1016/j.ejrh.2024.102148</titl>
            <parTitl xml:lang="en">Lidberg W. 2025. Deep learning-enhanced detection of road culverts in high-resolution digital elevation models: Improving stream network accuracy in Sweden. Journal of Hydrology: Regional Studies. V 57, 102148. https://doi.org/10.1016/j.ejrh.2024.102148</parTitl>
            <IDNo agency="DOI">10.1016/j.ejrh.2024.102148</IDNo>
          </titlStmt>
          <distStmt>
            <distDate date="2025">2025</distDate>
          </distStmt>
        </citation>
      </relPubl>
    </othrStdyMat>
  </stdyDscr>
</codeBook>