<codeBook xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xsi:schemaLocation="ddi:codebook:2_5 http://www.ddialliance.org/Specification/DDI-Codebook/2.5/XMLSchema/codebook.xsd" xmlns="ddi:codebook:2_5">
  <docDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Data för: "How does Adenine form from Hydrogen Cyanide?"</titl>
        <parTitl xml:lang="en">Data for: "How does Adenine form from Hydrogen Cyanide?"</parTitl>
        <IDNo agency="SND">2025-163-1</IDNo>
        <IDNo agency="DOI">https://doi.org/10.71870/gqyb-fj64</IDNo>
      </titlStmt>
      <prodStmt>
        <producer xml:lang="en" abbr="SND">Swedish National Data Service</producer>
        <producer xml:lang="sv" abbr="SND">Svensk nationell datatjänst</producer>
      </prodStmt>
      <holdings URI="https://doi.org/10.71870/gqyb-fj64">Landing page</holdings>
    </citation>
  </docDscr>
  <stdyDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">Data för: "How does Adenine form from Hydrogen Cyanide?"</titl>
        <parTitl xml:lang="en">Data for: "How does Adenine form from Hydrogen Cyanide?"</parTitl>
        <IDNo agency="SND">2025-163-1</IDNo>
        <IDNo agency="DOI">https://doi.org/10.71870/gqyb-fj64</IDNo>
      </titlStmt>
      <rspStmt>
        <AuthEnty xml:lang="en" affiliation="Department of Chemistry and Chemical Engineering, Chalmers University of Technology">Cappelletti, Marco</AuthEnty>
        <AuthEnty xml:lang="sv" affiliation="Institutionen för Kemi och Kemiteknik, Chalmers tekniska högskola">Cappelletti, Marco</AuthEnty>
        <AuthEnty xml:lang="en" affiliation="Department of Chemistry and Chemical Engineering, Chalmers University of Technology">Rahm, Martin</AuthEnty>
        <AuthEnty xml:lang="sv" affiliation="Institutionen för Kemi och Kemiteknik, Chalmers tekniska högskola">Rahm, Martin</AuthEnty>
      </rspStmt>
      <prodStmt>
        <grantNo xml:lang="en" agency="Swedish Research Council">2020-04305</grantNo>
        <grantNo xml:lang="sv" agency="Vetenskapsrådet">2020-04305</grantNo>
      </prodStmt>
      <distStmt>
        <distrbtr xml:lang="en" abbr="SND" URI="https://snd.se">Swedish National Data Service</distrbtr>
        <distrbtr xml:lang="sv" abbr="SND" URI="https://snd.se">Svensk nationell datatjänst</distrbtr>
        <distDate xml:lang="en" date="2026-01-12" />
      </distStmt>
      <verStmt>
        <version elementVersion="1" elementVersionDate="2026-01-12" />
      </verStmt>
      <holdings URI="https://doi.org/10.71870/gqyb-fj64">Landing page</holdings>
    </citation>
    <stdyInfo>
      <subject>
        <keyword xml:lang="en" vocab="GCMD" vocabURI="https://gcmd.nasa.gov/kms/concept/af157837-bdbd-4a9a-b24e-6a79adfef57f">HYDROGEN CYANIDE</keyword>
        <keyword xml:lang="en" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p2870">origin of life</keyword>
        <keyword xml:lang="sv" vocab="YSO" vocabURI="http://www.yso.fi/onto/yso/p2870">livets uppkomst</keyword>
      </subject>
      <abstract xml:lang="en" contentType="abstract">In this study, we present a quantum chemical evaluation of plausible chemical pathways from hydrogen cyanide (HCN) to adenine.

This dataset contains the input and output files of the quantum chemical calculations, as well as the python code, and the results, of the microkinetic modeling. 

Geometry optimizations, frequency analysis, and intrinsic reaction coordinate (IRC) calculations at the DFT level (B3LYP-D3BJ/6-31+G(d,p)) have been performed with the program Gaussian16, revision B.01.
Single-point calculations with DLPNO-CCSD(T)/aug-cc-pVTZ have been carried out using ORCA version 6.1. 

The python code for the microkinetic modeling has been developed by us, and it uses the LSODA solver as implemented in the scipy package. The code generates csv files containing the concentrations of the species at different times.

Folder structure:
------------------------------------
calculations/
    species_1/
        1-expl-HCN/
        2-expl-HCN/
        ...
    species_2 /
        1-expl-HCN/
        2-expl-HCN/
        ...
    ...
    TS_1/
        1-expl-HCN/
        2-expl-HCN/
        ...
    TS_2/
        1-expl-HCN/
        2-expl-HCN/
        ...
    ...
    tautomers/
        species_4_imine-taut/
        ...
kinetic_modeling/
    KineticSolver/
    results/
        distributions/
        statistical_analysis/
------------------------------------

calculations/:
It contains Gaussian16 and ORCA 6.1 input and output files of the calculations on species (species_[n] subfolders) and transition states (TS_[n] subfolders). These subfolder contains calculations on all solvation levels (up to 5 explicit HCN molecules, in the [n]-expl-HCN/ subsubfolders).
The tautomers/ subfolder contains the calculations on the imine tautomers of the species, whether it exists. These calculations have been performed with one explicit solvent HCN molecule.

kinetic_modeling/:
It contains the sub-folders KineticSolver/, with the python code, and results/, in which are the csv files of the results. 
distributions/ contains the results of all (~50000) Monte Carlo simulations, and statistical_analysis/ contains the script to calculate the median and the quantiles.</abstract>
      <abstract xml:lang="sv" contentType="abstract">I denna studie presenterar vi en kvantkemisk utvärdering av troliga kemiska vägar från vätecyanid (HCN) till adenin.

Denna datauppsättning innehåller in- och utdatafilerna för de kvantkemiska beräkningarna, samt pythonkoden och resultaten av den mikrokinetiska modelleringen.

Geometrioptimeringar, frekvensanalys och intrinsisk reaktionskoordinat (IRC) beräkningar på DFT-nivå (B3LYP-D3BJ/6-31+G(d,p)) har utförts med programmet Gaussian16, revision B.01.
Enpunktsberäkningar med DLPNO-CCSD(T)/aug-cc-pVTZ har utförts med ORCA version 6.1.

Pythonkoden för den mikrokinetiska modelleringen har utvecklats av oss och använder LSODA-lösaren som implementerats i scipy-paketet. Koden genererar csv-filer som innehåller koncentrationerna av arterna vid olika tidpunkter.

Mappstruktur:
------------------------------------
calculations/
    species_1/
        1-expl-HCN/
        2-expl-HCN/
        ...
    species_2 /
        1-expl-HCN/
        2-expl-HCN/
        ...
    ...
    TS_1/
        1-expl-HCN/
        2-expl-HCN/
        ...
    TS_2/
        1-expl-HCN/
        2-expl-HCN/
        ...
    ...
    tautomers/
        species_4_imine-taut/
        ...
kinetic_modeling/
    KineticSolver/
    results/
        distributions/
        statistical_analysis/
------------------------------------



beräkningar/:
Den innehåller Gaussian16 och ORCA 6.1 in- och utdatafiler för beräkningar på arter (undermappar species_[n]) och övergångstillstånd (undermappar TS_[n]). Dessa undermappar innehåller beräkningar på alla solvatiseringsnivåer (upp till 5 explicita HCN-molekyler, i undermapparna [n]-expl-HCN/).
Undermappen tautomers/ innehåller beräkningar på artens imin-tautomerer, oavsett om den existerar. Dessa beräkningar har utförts med en explicit solvent HCN-molekyl.

kinetic_modeling/:
Den innehåller undermapparna KineticSolver/, med pythonkoden, och results/, där csv-filerna för resultaten finns.
distributions/ innehåller resultaten av alla (~50000) Monte Carlo-simuleringar, och statistical_analysis/ innehåller skriptet för att beräkna medianen och kvantilerna.</abstract>
      <sumDscr>
        <dataKind xml:lang="en">Numeric</dataKind>
        <dataKind xml:lang="en">Text</dataKind>
      </sumDscr>
    </stdyInfo>
    <method>
      <dataColl />
    </method>
    <dataAccs>
      <useStmt>
        <restrctn xml:lang="en">Access to data through SND. Data are freely accessible.</restrctn>
        <restrctn xml:lang="sv">Åtkomst till data via SND. Data är fritt tillgängliga.</restrctn>
        <conditions elementVersion="info:eu-repo-Access-Terms vocabulary">openAccess</conditions>
      </useStmt>
    </dataAccs>
    <othrStdyMat />
  </stdyDscr>
</codeBook>