Statistik över namn efter födelseland 2020
https://doi.org/10.5878/s91g-y391
Detta dataset innehåller statistik över namn (tilltalsnamn på kvinnor, tilltalsnamn på män, samt efternamn) efter födelseland. Totalt är det 231 505 namn uppdelade på 202 länder. Datan kommer från SCB:s befolkningsstatistik/namnregister och avser personer folkbokförda i Sverige 31 december 2020. Vissa namn är dock exkluderade på grund av sekretess, såsom namn med färre än fem bärare. Datan är licensierad med Creative Commons Attribution 4.0 International (CC BY 4.0) och får användas så länge SCB anges som källa. I detta dataset hittar du (förutom originaldatan från SCB) även bearbetningar där ISO-kod för varje land har lagts till samt data i så kallat wide format och long format för att underlätta vidare databehandling.
Datatsetet består av följande:
namn-efter-fodelseland-2020.xlsx (129 MB) är den obearbetade originalfilen levererad från SCB. Datan är i så kallat wide format med namn på raderna och länderna i kolumnerna. Totalt är det 202 länder plus kolumnen Ospecificerade länder längst till höger.
namn-minst-tva-barare-2020.xlsx (12 MB) innehåller namn med minst två bärare 31 december 2020 från SCB.
SCB-villkor (0,1 MB) beskriver SCB:s allmänna villkor för avtal och överenskommelser vad gäller användandet av datan.
Därtill finns det tre CSV-filer (3,5 MB) där originalfilen har bearbetats till CSV-filer i wide format som underlättar maskinläsning. Vid wide format har originalstrukturen bibehållits med namnen på raderna och länderna i kolumnen. Däremot har länderna ersatts med sina respektive ISO-koder för att undvika problemet med mellanslag och svenska tecken i kolumnnamnen.
Det finns även tre ytterligare CSV-filer (141 MB) där originalfilen har bearbetats till CSV-filer i long format som underlättar maskinläsning. Vid long format återupprepas namnet på varje rad för respektive land och det totala antalet bärare för namnet ifråga. Dessutom finns en landskod i ISO-format med varje land för att enkelt kunna integreras i andra typer av analyser.
Citering och åtkomst
Citering och åtkomst
Tillgänglighetsnivå:
Skapare/primärforskare:
Forskningshuvudman:
Data innehåller personuppgifter:
Nej
Citering:
Språk:
Metod och utfall
Metod och utfall
Analysenhet:
Population:
Sverige
Tidsdimension:
Urvalsmetod:
Tidsperiod(er) som undersökts:
Antal individer/objekt:
231505
Datainsamling - Aggregation
Datainsamling - Aggregation
Insamlingsmetod:
Aggregation
Datainsamlare:
- Statistiska centralbyrån (SCB)
Datakälla:
- Register/handlingar/förteckningar
- Befolkningsgrupp
Geografisk täckning
Geografisk täckning
Geografisk plats:
Geografisk beskrivning:
Sveriges befolkning efter födelseland.
Lägsta geografiska enhet:
Land
Högsta geografiska enhet:
Land
Administrativ information
Administrativ information
Ansvarig institution/enhet:
Institutionen för journalistik, medier och kommunikation (JMG)
Finansiering
Finansiering
Finansiär:
- Institutet för mediestudier
Ämnesområde och nyckelord
Ämnesområde och nyckelord
CESSDA Topic Classification:
Standard för svensk indelning av forskningsämnen 2025:
Nyckelord:
Relationer
Relationer
Relaterade forskningsdata:
Publikationer
Publikationer
Citering:
Dahlgren, P. M. (2021). Svenskar eller utrikesfödda i medierna? – att identifiera födelseland från namn. I: L.
Truedsson (red.) Vitt eller brett? – vilka får ta plats i medier och på redaktioner. Stockholm: Institutet för
mediestudier.
ISBN:
978-91-987098-0-3
Metadata
Metadata
Version 1
