<ddi:DDIInstance xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="ddi:instance:3_3 http://ddialliance.org/Specification/DDI-Lifecycle/3.3/XMLSchema/instance.xsd" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:ddi="ddi:instance:3_3" xmlns:r="ddi:reusable:3_3" xmlns:s="ddi:studyunit:3_3" xmlns:d="ddi:datacollection:3_3" xmlns:a="ddi:archive:3_3" xmlns:c="ddi:conceptualcomponent:3_3" xmlns:cm="ddi:comparative:3_3" xmlns:g="ddi:group:3_3" xmlns:l="ddi:logicalproduct:3_3" xmlns:p="ddi:physicaldataproduct:3_3" xmlns:pi="ddi:physicalinstance:3_3" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xhtml="http://www.w3.org/1999/xhtml" xmlns:xml="http://www.w3.org/XML/1998/namespace" isMaintainable="true" scopeOfUniqueness="Agency">
  <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71:0</r:URN>
  <r:Agency>SND</r:Agency>
  <r:ID>doi-10-23695-9bnq-xc71</r:ID>
  <r:Version>0</r:Version>
  <g:ResourcePackage>
    <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.ResourcePackage:2.0</r:URN>
    <r:OtherMaterialScheme>
      <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.OtherMaterialScheme:2.0</r:URN>
    </r:OtherMaterialScheme>
    <a:OrganizationScheme>
      <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.OrganizationScheme-0:2.0</r:URN>
      <a:Organization>
        <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.Organization-0:2.0</r:URN>
        <a:OrganizationIdentification>
          <a:OrganizationName>
            <r:String xml:lang="en">Språkbanken Text</r:String>
          </a:OrganizationName>
        </a:OrganizationIdentification>
      </a:Organization>
    </a:OrganizationScheme>
  </g:ResourcePackage>
  <s:StudyUnit>
    <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.StudyUnit:2.0</r:URN>
    <r:UserID typeOfUserID="datasetIdentifier">doi-10-23695-9bnq-xc71</r:UserID>
    <r:Citation>
      <r:Title>
        <r:String xml:lang="sv">Svenska tidningar 1818-1870</r:String>
        <r:String xml:lang="en">Swedish newspapers 1818-1870</r:String>
      </r:Title>
      <r:Creator>
        <r:CreatorReference>
          <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.Individual-0:2.0</r:URN>
          <r:TypeOfObject>Individual</r:TypeOfObject>
        </r:CreatorReference>
      </r:Creator>
      <r:Publisher>
        <r:PublisherName>
          <r:String xml:lang="sv">Göteborgs universitet</r:String>
          <r:String xml:lang="en">University of Gothenburg</r:String>
        </r:PublisherName>
      </r:Publisher>
      <r:Publisher>
        <r:PublisherName>
          <r:String xml:lang="sv">Göteborgs universitet</r:String>
          <r:String xml:lang="en">University of Gothenburg</r:String>
        </r:PublisherName>
      </r:Publisher>
      <r:PublicationDate>
        <r:SimpleDate>2024-01-01</r:SimpleDate>
      </r:PublicationDate>
      <r:InternationalIdentifier>
        <r:IdentifierContent>10.23695/9BNQ-XC71</r:IdentifierContent>
        <r:ManagingAgency controlledVocabularyAgencyName="DOI">DOI</r:ManagingAgency>
      </r:InternationalIdentifier>
    </r:Citation>
    <r:Abstract>
      <r:Content xml:lang="sv">Svenska tidningar 1818–1870 innehåller ett urval av digitaliserade versioner av svenska tidningar från 1818 till 1870. Det är en del av den så kallad Kubhist corpus  which was digitized at  Kubhist-korpus som digitaliserades av Kungliga biblioteket (KB). En tidning valdes slumpmässigt from varje år. För varje tidning valdes två sidor, andra och fjärde. Sidorna  bearbetades automatiskt med hjälp av avancerad dokumentlayoutanalys där varje segment i den digitaliserade sidan inramades och numrerades. Vidare har varje segment bearbetades med Abbyy FineReader version 11 och slutligen transkriberades manuellt av ett transkriptionsföretag som är specialiserat på så kallad double-keying.

  Denna datamängd innehåller 106 sidor, 5,059 segments och 186,013 ord totalt.

  Materialet producerades inom projektet Utvärdering och förfining av en förbättrad OCR-process för massdigitalisering som finansieras av RJ (dnr IN18-0940: 1) för perioden 2019-2020.</r:Content>
      <r:Content xml:lang="en">Svenska tidningar 1818–1870 contains a selection of digitized versions of Swedish newspapers from 1818 to 1870. It is part of the so called Kubhist corpus  which was digitized at Kungliga biblioteket (KB). One newspaper was randomly selected from each year. For each newspaper two pages were selected, the second and fourth. All pages were automatically processed using advanced document layout analysis where each segment in the digitized page was framed and numbered. Each segment was processed with Abbyy FineReader version 11 and was manually transcribed by a transcription company who specializes in double-keying.

This particular subset contains 106 pages, 5,059 segments and 186,013 words in total.

  It was produced as a part of the project Evaluation and refinement of an enhanced OCR-process for mass digitisation financed by RJ (dnr IN18-0940:1) for the period of 2019-2020.</r:Content>
    </r:Abstract>
    <r:Coverage>
      <r:TopicalCoverage>
        <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.TopicalCoverage:2.0</r:URN>
        <r:Subject xml:lang="en" controlledVocabularyID="10208" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Natural Language Processing</r:Subject>
        <r:Subject xml:lang="sv" controlledVocabularyID="10208" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Språkbehandling och datorlingvistik</r:Subject>
      </r:TopicalCoverage>
      <r:SpatialCoverage />
    </r:Coverage>
    <a:Archive>
      <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.Archive:2.0</r:URN>
      <a:ArchiveSpecific>
        <a:Item>
          <a:Access>
            <r:URN>urn:ddi:se.researchdata:doi-10-23695-9bnq-xc71.Archive-ArchiveSpecificType-AccessType:2.0</r:URN>
            <a:TypeOfAccess controlledVocabularyName="info:eu-repo-Access-Terms vocabulary"></a:TypeOfAccess>
          </a:Access>
          <a:DataFileQuantity>0</a:DataFileQuantity>
        </a:Item>
      </a:ArchiveSpecific>
    </a:Archive>
  </s:StudyUnit>
</ddi:DDIInstance>