<codeBook xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="ddi:codebook:2_5 http://www.ddialliance.org/Specification/DDI-Codebook/2.5/XMLSchema/codebook.xsd" xmlns="ddi:codebook:2_5">
  <docDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Data för: Coverage of Web Accessibility Guidelines Provided by Automated Checking Tools</titl>
        <parTitl xml:lang="en">Data for: Coverage of Web Accessibility Guidelines Provided by Automated Checking Tools</parTitl>
        <IDNo agency="SND">2024-523-1</IDNo>
        <IDNo agency="his.se">20200013</IDNo>
        <IDNo agency="DOI">https://doi.org/10.5878/qe0c-kb63</IDNo>
      </titlStmt>
      <prodStmt>
        <producer xml:lang="en" abbr="SND">Swedish National Data Service</producer>
        <producer xml:lang="sv" abbr="SND">Svensk nationell datatjänst</producer>
      </prodStmt>
      <holdings URI="https://doi.org/10.5878/qe0c-kb63">Landing page</holdings>
    </citation>
  </docDscr>
  <stdyDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Data för: Coverage of Web Accessibility Guidelines Provided by Automated Checking Tools</titl>
        <parTitl xml:lang="en">Data for: Coverage of Web Accessibility Guidelines Provided by Automated Checking Tools</parTitl>
        <IDNo agency="SND">2024-523-1</IDNo>
        <IDNo agency="his.se">20200013</IDNo>
        <IDNo agency="DOI">https://doi.org/10.5878/qe0c-kb63</IDNo>
      </titlStmt>
      <rspStmt>
        <AuthEnty xml:lang="en" affiliation="School of Informatics, University of Skövde">Fischer, Thomas</AuthEnty>
        <AuthEnty xml:lang="sv" affiliation="Institutionen för informationsteknologi, Högskolan i Skövde">Fischer, Thomas</AuthEnty>
      </rspStmt>
      <prodStmt>
        <grantNo xml:lang="en" agency="Knowledge Foundation">20200013</grantNo>
        <grantNo xml:lang="sv" agency="KK-stiftelsen">20200013</grantNo>
      </prodStmt>
      <distStmt>
        <distrbtr xml:lang="en" abbr="SND" URI="https://snd.se">Swedish National Data Service</distrbtr>
        <distrbtr xml:lang="sv" abbr="SND" URI="https://snd.se">Svensk nationell datatjänst</distrbtr>
        <distDate xml:lang="en" date="2025-08-25" />
      </distStmt>
      <verStmt>
        <version elementVersion="1" elementVersionDate="2025-08-25" />
      </verStmt>
      <holdings URI="https://doi.org/10.5878/qe0c-kb63">Landing page</holdings>
    </citation>
    <stdyInfo>
      <subject>
        <keyword xml:lang="en" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p7104">public sector</keyword>
        <keyword xml:lang="sv" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p7104">offentliga sektorn</keyword>
        <keyword xml:lang="en" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p16241">accessibility</keyword>
        <keyword xml:lang="sv" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p16241">tillgänglighet</keyword>
        <keyword xml:lang="en" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p13019">Python (programming languages)</keyword>
        <keyword xml:lang="sv" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p13019">Python</keyword>
        <keyword xml:lang="en" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p38229">JSON</keyword>
        <keyword xml:lang="sv" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p38229">JSON</keyword>
        <keyword xml:lang="en" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p4050">web pages</keyword>
        <keyword xml:lang="sv" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p4050">webbsidor</keyword>
      </subject>
      <abstract xml:lang="en" contentType="abstract">This data set contains three parts:

1. A collection of the raw data, which includes (a) the retrieved landing page of each analyzed PSO (to be precise, the DOM presentation from a browser showing this page) both in HTML and text (text without HTML tags), (b) for each of the six automated checker/engine combination one log file, (c) other metadata such as text file containing tools' and libraries' version information.
Data of case 1(a) may contain personal data (details see below) and is thus kept in a separate archive file and is only available upon request. Data of case 1(b) has been stripped of personal data and thus may get shared freely.
This data allows investigating how the webpages looked at the time of the study and to which assessments the then-current automated checkers came. Future studies can reproduce the same setup and, for example, compare changes over time in PSOs' webpages' accessibility.

2. A "coverage" file that is essentially a big database on WCAG-2 success criteria, their metadata, and links to automated checkers' documentation and source code. The "coverage" file combines information from various sources, such as information scrapped from W3C web page, accessibility tools' Git repositories, or AXE's documentation. Other researchers can load this "coverage" file to get a database of WCAG-2 success criteria and associated metadata in their data analysis without performing those error-prone and tedious steps themselves.

3. A collection of Python files. This not only allows reproducing how raw data was process and filtered (up to the output of LaTeX code), but allows other researchers to get inspiration how to solve problems addressed in this code base as well as to re-use code in their own projects.

The data covered by case 1(a) above includes textual data collected from publicly available web pages of Swedish public sector organizations (PSOs), which may include names, contact details, or other personal or biographical information. Due to the directory structure, for every file the origin of the data is determined, so any further questions about the handling of personal data shall be directed to the respective PSO.</abstract>
      <abstract xml:lang="sv" contentType="abstract">Detta dataset innehåller tre delar:

1. En samling rådata som innehåller (a) den hämtade landningssidan för varje analyserad PSO (närmare bestämt DOM-presentationen från en webbläsare som visar denna sida) både i HTML och text (text utan HTML-taggar), (b) en loggfil för var och en av de sex automatiska kontroll-/motorkombinationerna, (c) andra metadata såsom en textfil som innehåller verktygens och bibliotekens versionsinformation.

Uppgifter om fall 1(a) kan innehålla personuppgifter och förvaras därför i ett separat arkivfil och kan endast lämnas ut på förfrågan. Uppgifter om fall 1(b) har rensats på personuppgifter och kan därför delas fritt.

Dessa data gör det möjligt att undersöka hur webbsidorna såg ut vid tidpunkten för studien och vilka bedömningar de då aktuella automatiska kontrollerna gjorde. Framtida studier kan upprepa samma upplägg och t.ex. jämföra förändringar över tid i tillgängligheten på PSO:ernas webbsidor.

2. En ”täckningsfil” som i princip är en stor databas över WCAG-2:s framgångskriterier, deras metadata och länkar till dokumentation och källkod för automatiserade kontrollprogram. ”Täckningsfilen” kombinerar information från olika källor, t.ex. information som hämtats från W3C:s webbsida, tillgänglighetsverktygens Git-arkiv eller AXE:s dokumentation. Andra forskare kan ladda denna ”täckningsfil” för att få en databas med WCAG-2 framgångskriterier och tillhörande metadata i sin dataanalys utan att själva utföra dessa felbenägna och tråkiga steg.

3. En samling Python-filer. Detta gör det inte bara möjligt att reproducera hur rådata bearbetades och filtrerades (upp till utdata av LaTeX-kod), utan gör det också möjligt för andra forskare att få inspiration till hur man löser problem som tas upp i denna kodbas samt att återanvända kod i sina egna projekt.

De uppgifter som omfattas av fall 1(a) ovan inkluderar textuppgifter som samlats in från offentligt tillgängliga webbsidor tillhörande svenska offentliga organisationer (PSO), vilka kan innehålla namn, kontaktuppgifter eller annan personlig eller biografisk information. På grund av katalogstrukturen fastställs uppgifternas ursprung för varje fil, så eventuella ytterligare frågor om hanteringen av personuppgifter ska riktas till respektive PSO.</abstract>
      <sumDscr>
        <nation xml:lang="en" abbr="SE">Sweden</nation>
        <nation xml:lang="sv" abbr="SE">Sverige</nation>
        <dataKind xml:lang="en">Text</dataKind>
      </sumDscr>
    </stdyInfo>
    <method>
      <dataColl>
        <collMode xml:lang="en">Using various self-written scripts (Python), data has been collected from various only online resources (W3C.org, GitHub, …) as well as automated accessibility checkers were instructed to scan and evaluate a number of webpages.
Data was stored, depending on the data and origin, in (a) raw format as retrieved or (b) moderately processed in JSON or plain text files. Collected data was further processed via self-written Python scripts into LaTeX code for use in the final manuscript.<concept vocab="DDI Mode of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/5.0.0?languageVersion=en-5.0.0">Using various self-written scripts (Python), data has been collected from various only online resources (W3C.org, GitHub, …) as well as automated accessibility checkers were instructed to scan and evaluate a number of webpages.
Data was stored, depending on the data and origin, in (a) raw format as retrieved or (b) moderately processed in JSON or plain text files. Collected data was further processed via self-written Python scripts into LaTeX code for use in the final manuscript.</concept></collMode>
        <collMode xml:lang="sv">Med hjälp av olika självskrivna skript (Python) har data samlats in från olika onlinekällor (W3C.org, GitHub, ...) och automatiska tillgänglighetskontroller har anvisats att skanna och utvärdera ett antal webbsidor.

Data lagrades, beroende på data och ursprung, i (a) råformat som hämtat eller (b) måttligt bearbetat i JSON- eller vanliga textfiler. Insamlad data bearbetades vidare via självskrivna Python-skript till LaTeX-kod för användning i det slutliga manuskriptet.<concept vocab="DDI Mode of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/5.0.0?languageVersion=sv-5.0.0">Med hjälp av olika självskrivna skript (Python) har data samlats in från olika onlinekällor (W3C.org, GitHub, ...) och automatiska tillgänglighetskontroller har anvisats att skanna och utvärdera ett antal webbsidor.

Data lagrades, beroende på data och ursprung, i (a) råformat som hämtat eller (b) måttligt bearbetat i JSON- eller vanliga textfiler. Insamlad data bearbetades vidare via självskrivna Python-skript till LaTeX-kod för användning i det slutliga manuskriptet.</concept></collMode>
        <collMode xml:lang="en">Compilation/Synthesis<concept vocab="DDI Mode of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/5.0.0?languageVersion=en-5.0.0">Compilation/Synthesis</concept></collMode>
        <collMode xml:lang="sv">Kompilering/Syntes<concept vocab="DDI Mode of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/5.0.0?languageVersion=sv-5.0.0">Kompilering/Syntes</concept></collMode>
      </dataColl>
    </method>
    <dataAccs>
      <useStmt>
        <restrctn xml:lang="en">Access to data through SND. Access to data is restricted.</restrctn>
        <restrctn xml:lang="sv">Åtkomst till data via SND. Tillgång till data är begränsad.</restrctn>
        <conditions elementVersion="info:eu-repo-Access-Terms vocabulary">restrictedAccess</conditions>
      </useStmt>
    </dataAccs>
    <othrStdyMat />
  </stdyDscr>
</codeBook>