<codeBook xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="ddi:codebook:2_5 http://www.ddialliance.org/Specification/DDI-Codebook/2.5/XMLSchema/codebook.xsd" xmlns="ddi:codebook:2_5">
  <docDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Statistik över namn efter födelseland 2020</titl>
        <parTitl xml:lang="en">Statistics on Swedish names by birth country 2020</parTitl>
        <IDNo agency="SND">2021-272-1-1</IDNo>
        <IDNo agency="DOI">https://doi.org/10.5878/s91g-y391</IDNo>
      </titlStmt>
      <prodStmt>
        <producer xml:lang="en" abbr="SND">Swedish National Data Service</producer>
        <producer xml:lang="sv" abbr="SND">Svensk nationell datatjänst</producer>
      </prodStmt>
      <holdings URI="https://doi.org/10.5878/s91g-y391">Landing page</holdings>
    </citation>
  </docDscr>
  <stdyDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Statistik över namn efter födelseland 2020</titl>
        <parTitl xml:lang="en">Statistics on Swedish names by birth country 2020</parTitl>
        <IDNo agency="SND">2021-272-1-1</IDNo>
        <IDNo agency="DOI">https://doi.org/10.5878/s91g-y391</IDNo>
        <IDNo agency="ISBN">978-91-987098-0-3</IDNo>
      </titlStmt>
      <rspStmt>
        <AuthEnty xml:lang="en" affiliation="Department of Journalism, Media and Communication, University of Gothenburg">Dahlgren, Peter M.</AuthEnty>
        <AuthEnty xml:lang="sv" affiliation="Institutionen för journalistik, medier och kommunikation (JMG), Göteborgs universitet">Dahlgren, Peter M.</AuthEnty>
      </rspStmt>
      <prodStmt />
      <distStmt>
        <distrbtr xml:lang="en" abbr="SND" URI="https://snd.se">Swedish National Data Service</distrbtr>
        <distrbtr xml:lang="sv" abbr="SND" URI="https://snd.se">Svensk nationell datatjänst</distrbtr>
        <distDate xml:lang="en" date="2021-11-02" />
      </distStmt>
      <verStmt>
        <version elementVersion="1" elementVersionDate="2021-11-02" />
      </verStmt>
      <holdings URI="https://doi.org/10.5878/s91g-y391">Landing page</holdings>
    </citation>
    <stdyInfo>
      <subject>
        <topcClas xml:lang="en" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=Demography.Censuses">Censuses</topcClas>
        <topcClas xml:lang="sv" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=Demography.Censuses">Folkräkningar</topcClas>
        <topcClas xml:lang="en" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=MediaCommunicationAndLanguage.LanguageAndLinguistics">Language and linguistics</topcClas>
        <topcClas xml:lang="sv" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=MediaCommunicationAndLanguage.LanguageAndLinguistics">Språk och lingvistik</topcClas>
        <topcClas xml:lang="en" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=SocialStratificationAndGroupings.Minorities">Minorities</topcClas>
        <topcClas xml:lang="sv" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=SocialStratificationAndGroupings.Minorities">Minoriteter</topcClas>
      </subject>
      <abstract xml:lang="en" contentType="abstract">This dataset contains statistics on names (first names of women, first names of men, and last names) by country of birth. In total, there are 231,505 names by 202 countries. The data comes from Statistics Sweden's population statistics (name register) and refers to persons registered in Sweden on December 31st, 2020. However, some names are excluded due to confidentiality, such as names with fewer than five carriers. The data is licensed with Creative Commons Attribution 4.0 International (CC BY 4.0) and may be used as long as Statistics Sweden is stated as the source. In this dataset, you will also find (in addition to the original data from Statistics Sweden) tidied data where the ISO code for each country has been added, as well as data in so-called wide format and long format to facilitate easier data processing.

Please see the Swedish version of the post and the README file for more information about the data.</abstract>
      <abstract xml:lang="sv" contentType="abstract">Detta dataset innehåller statistik över namn (tilltalsnamn på kvinnor, tilltalsnamn på män, samt efternamn) efter födelseland. Totalt är det 231 505 namn uppdelade på 202 länder. Datan kommer från SCB:s befolkningsstatistik/namnregister och avser personer folkbokförda i Sverige 31 december 2020. Vissa namn är dock exkluderade på grund av sekretess, såsom namn med färre än fem bärare. Datan är licensierad med Creative Commons Attribution 4.0 International (CC BY 4.0) och får användas så länge SCB anges som källa. I detta dataset hittar du (förutom originaldatan från SCB) även bearbetningar där ISO-kod för varje land har lagts till samt data i så kallat wide format och long format för att underlätta vidare databehandling.

Datatsetet består av följande:
namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger.

namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 2020 från SCB. 

SCB-villkor (0,1 MB) beskriver SCB:s allmänna villkor för avtal och överenskommelser vad gäller användandet av datan.

Därtill finns det tre CSV-filer (3,5 MB) där originalfilen har bearbetats till CSV-filer i wide format som underlättar maskinläsning. Vid wide format har originalstrukturen bibehållits med namnen på raderna och länderna i kolumnen. Däremot har länderna ersatts med sina respektive ISO-koder för att undvika problemet med mellanslag och svenska tecken i kolumnnamnen.

Det finns även tre ytterligare CSV-filer (141 MB) där originalfilen har bearbetats till CSV-filer i long format som underlättar maskinläsning. Vid long format återupprepas namnet på varje rad för respektive land och det totala antalet bärare för namnet ifråga. Dessutom finns en landskod i ISO-format med varje land för att enkelt kunna integreras i andra typer av analyser.</abstract>
      <sumDscr>
        <nation xml:lang="en" abbr="SE">Sweden</nation>
        <nation xml:lang="sv" abbr="SE">Sverige</nation>
        <anlyUnit xml:lang="en" unit="Individual">Individual<concept vocab="DDI Analysis Unit" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/AnalysisUnit/2.1.3?languageVersion=en-2.1.3">Individual</concept></anlyUnit>
        <anlyUnit xml:lang="sv" unit="Individ">Individ<concept vocab="DDI Analysis Unit" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/AnalysisUnit/2.1.3?languageVersion=sv-2.1.3">Individ</concept></anlyUnit>
        <universe xml:lang="en">Sverige</universe>
        <universe xml:lang="sv">Sverige</universe>
        <dataKind xml:lang="en">Numeric</dataKind>
        <dataKind xml:lang="en">Text</dataKind>
      </sumDscr>
    </stdyInfo>
    <method>
      <dataColl>
        <timeMeth xml:lang="en">Cross-section<concept vocab="DDI Time Method" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/TimeMethod/1.2.3?languageVersion=en-1.2.3">Cross-section</concept></timeMeth>
        <timeMeth xml:lang="sv">Tvärsnitt<concept vocab="DDI Time Method" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/TimeMethod/1.2.3?languageVersion=sv-1.2.3">Tvärsnitt</concept></timeMeth>
        <sampProc xml:lang="en">Total universe/Complete enumeration<concept vocab="DDI Sampling Procedure" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/SamplingProcedure/2.0.1?languageVersion=en-2.0.1">Total universe/Complete enumeration</concept></sampProc>
        <sampProc xml:lang="sv">Hela populationen/total räkning<concept vocab="DDI Sampling Procedure" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/SamplingProcedure/2.0.1?languageVersion=sv-2.0.1">Hela populationen/total räkning</concept></sampProc>
        <collMode xml:lang="en">Aggregation<concept vocab="DDI Mode of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/5.0.0?languageVersion=en-5.0.0">Aggregation</concept></collMode>
        <collMode xml:lang="sv">Aggregation<concept vocab="DDI Mode of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/5.0.0?languageVersion=sv-5.0.0">Aggregation</concept></collMode>
      </dataColl>
    </method>
    <dataAccs>
      <useStmt>
        <restrctn xml:lang="en">Access to data through SND. Data are freely accessible.</restrctn>
        <restrctn xml:lang="sv">Åtkomst till data via SND. Data är fritt tillgängliga.</restrctn>
        <conditions elementVersion="info:eu-repo-Access-Terms vocabulary">openAccess</conditions>
      </useStmt>
    </dataAccs>
    <othrStdyMat>
      <relPubl>
        <citation>
          <titlStmt>
            <titl xml:lang="sv">Dahlgren, P. M. (2021). Svenskar eller utrikesfödda i medierna? – att identifiera födelseland från namn. I: L.
Truedsson (red.) Vitt eller brett? – vilka får ta plats i medier och på redaktioner. Stockholm: Institutet för
mediestudier.</titl>
            <parTitl xml:lang="en">Dahlgren, P. M. (2021). Svenskar eller utrikesfödda i medierna? – att identifiera födelseland från namn. I: L.
Truedsson (red.) Vitt eller brett? – vilka får ta plats i medier och på redaktioner. Stockholm: Institutet för
mediestudier.</parTitl>
            <IDNo agency="ISBN">978-91-987098-0-3</IDNo>
          </titlStmt>
          <distStmt>
            <distDate date="2021">2021</distDate>
          </distStmt>
        </citation>
      </relPubl>
    </othrStdyMat>
  </stdyDscr>
</codeBook>