<ddi:DDIInstance xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="ddi:instance:3_3 http://ddialliance.org/Specification/DDI-Lifecycle/3.3/XMLSchema/instance.xsd" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:ddi="ddi:instance:3_3" xmlns:r="ddi:reusable:3_3" xmlns:s="ddi:studyunit:3_3" xmlns:d="ddi:datacollection:3_3" xmlns:a="ddi:archive:3_3" xmlns:c="ddi:conceptualcomponent:3_3" xmlns:cm="ddi:comparative:3_3" xmlns:g="ddi:group:3_3" xmlns:l="ddi:logicalproduct:3_3" xmlns:p="ddi:physicaldataproduct:3_3" xmlns:pi="ddi:physicalinstance:3_3" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xhtml="http://www.w3.org/1999/xhtml" xmlns:xml="http://www.w3.org/XML/1998/namespace" isMaintainable="true" scopeOfUniqueness="Agency">
  <r:URN>urn:ddi:se.researchdata:2023-202:2</r:URN>
  <r:Agency>SND</r:Agency>
  <r:ID>2023-202</r:ID>
  <r:Version>2</r:Version>
  <g:ResourcePackage>
    <r:URN>urn:ddi:se.researchdata:2023-202.ResourcePackage:2.0</r:URN>
    <r:OtherMaterialScheme>
      <r:URN>urn:ddi:se.researchdata:2023-202.OtherMaterialScheme:2.0</r:URN>
    </r:OtherMaterialScheme>
    <a:OrganizationScheme>
      <r:URN>urn:ddi:se.researchdata:2023-202.OrganizationScheme-0:2.0</r:URN>
      <a:Individual>
        <r:URN>urn:ddi:se.researchdata:2023-202.Individual-0:2.0</r:URN>
        <r:UserAttributePair>
          <r:AttributeKey>affiliation</r:AttributeKey>
          <r:AttributeValue>Department of Molecular Biosciences, Stockholm University</r:AttributeValue>
        </r:UserAttributePair>
        <a:IndividualIdentification>
          <a:IndividualName>
            <a:FirstGiven>Joel</a:FirstGiven>
            <a:LastFamily>Hallgren</a:LastFamily>
            <a:FullName>
              <r:String>Joel Hallgren</r:String>
            </a:FullName>
          </a:IndividualName>
          <a:ResearcherID>
            <a:TypeOfID>ORCID</a:TypeOfID>
            <a:ResearcherIdentification>0000-0001-8602-8095</a:ResearcherIdentification>
          </a:ResearcherID>
        </a:IndividualIdentification>
      </a:Individual>
    </a:OrganizationScheme>
  </g:ResourcePackage>
  <s:StudyUnit>
    <r:URN>urn:ddi:se.researchdata:2023-202.StudyUnit:2.0</r:URN>
    <r:UserID typeOfUserID="datasetIdentifier">2023-202</r:UserID>
    <r:Citation>
      <r:Title>
        <r:String xml:lang="sv">Detaljerad beskrivning av bildanalysarbetsflödet, inklusive träningsdata för maskininlärningsmodell, för artikeln: "Phosphate starvation decouples cell differentiation from DNA replication control in the dimorphic bacterium Caulobacter crescentus", Hallgren et al. (2023; PLOS Genetics).</r:String>
        <r:String xml:lang="en">Detailed description of the image analysis workflow, including machine learning model training dataset, for the article: "Phosphate starvation decouples cell differentiation from DNA replication control in the dimorphic bacterium Caulobacter crescentus", Hallgren et al. (2023; PLOS Genetics).</r:String>
      </r:Title>
      <r:Creator>
        <r:CreatorReference>
          <r:URN>urn:ddi:se.researchdata:2023-202.Individual-0:2.0</r:URN>
          <r:TypeOfObject>Individual</r:TypeOfObject>
        </r:CreatorReference>
      </r:Creator>
      <r:Publisher>
        <r:PublisherName>
          <r:String xml:lang="sv">Stockholms universitet</r:String>
          <r:String xml:lang="en">Stockholm University</r:String>
        </r:PublisherName>
      </r:Publisher>
      <r:Publisher>
        <r:PublisherName>
          <r:String xml:lang="sv">Stockholms universitet</r:String>
          <r:String xml:lang="en">Stockholm University</r:String>
        </r:PublisherName>
      </r:Publisher>
      <r:PublicationDate>
        <r:SimpleDate>2023-11-20</r:SimpleDate>
      </r:PublicationDate>
      <r:InternationalIdentifier>
        <r:IdentifierContent>10.58141/paxd-vr47</r:IdentifierContent>
        <r:ManagingAgency controlledVocabularyAgencyName="DOI">DOI</r:ManagingAgency>
      </r:InternationalIdentifier>
    </r:Citation>
    <r:Abstract>
      <r:Content xml:lang="sv">Detta dataset innehåller en detaljerad beskrivning av bildanalysproceduren som användes av Hallgren et al. (2023; PLOS Genetics) för att utföra mätningar av individuella celler av bakterien Caulobacter crescentus. Mer specifikt identifierar proceduren individuella C. crescentus-celler i faskontrastmikroskopibilder, annoterar deras celltyp, samt deras storlek och grundläggande morfologiska egenskaper. Proceduren kan till exempel användas för att kvantifiera förhållandet mellan antalet svärmarceller och stjälkceller i en population, mäta storleken av celler och deras stjälkar, samt uppskatta proportionen av celler som genomgår celldelning i en population.

Datasetet inkluderar: (1) projektfiler för programmet ilastik, (2) Python-kod och ImageJ-macros som används för databearbetning, (3) inställningar för ’batch processing’ av bilder med ImageJ-pluginet ’MicrobeJ’, och (4) exempeldata som kan användas för att köra bildanalysen från början till slut. Projektfilerna för ilastik (.ilp-filer) innehåller ’random forest’-maskininlärningsmodellerna som används i analysen, samt de träningsdata som användes för att generera dessa modeller. ’README’-filen innehåller instruktion om hur man kan köra bildanalysproceduren från början till slut.

Även om maskininlärningsmodellerna är tränade på bilder tagna under våra specifika mikroskopiförhållanden, kan informationen som presenteras här användas för att enkelt anpassa en motsvarande bildanalysprocedur i ett nytt laboratorium genom att träna nya ilastik-modeller och modifiera MicrobeJ-inställningarna.

Numeriska data bakom grafer och statistiska analyser i artikeln (Hallgren et al., 2023) har även inkluderats i form av tabulärdata som ett zip-arkiv.</r:Content>
      <r:Content xml:lang="en">This dataset contains a detailed description of the image analysis procedure used in Hallgren et al. (2023; PLOS Genetics) to perform single-cell measurements of the bacterium Caulobacter crescentus. More specifically, the procedure identifies individual C. crescentus cells in phase-contrast microscopy pictures, annotates their cell type, as well as their size and basic morphological features. The procedure can for example be used to quantify the proportion of swarmer cells to stalked cells in a population, to measure the size of cells and their stalks, and to determine the fraction of constricted predivisional cells in a population.

The dataset includes: (1) ilastik project files, (2) custom Python scripts and ImageJ macros used for data processing, (3) settings for batch processing of images with the ImageJ plugin ‘MicrobeJ’, and (4) example data that can be used to run the image analysis pipeline from start to finish. The ilastik project files (.ilp) contain the random forest machine learning models used for their analysis, as well as the training dataset used to generate those models. The README file contains instructions on how to run the image analysis pipeline from start to finish.

Although the machine learning models are trained specifically on images taken using our specific microscopy setup, the information and code present in this dataset can be used to easily set up a corresponding image analysis pipeline for a new laboratory, essentially by training new ilastik models and tweaking the MicrobeJ settings.

Additionally, underlying numerical data for all of graphs and summary statistics of the article (Hallgren et al., 2023) have been included in the form of tabular data in a zip archive.</r:Content>
    </r:Abstract>
    <r:Coverage>
      <r:TopicalCoverage>
        <r:URN>urn:ddi:se.researchdata:2023-202.TopicalCoverage:2.0</r:URN>
        <r:Subject xml:lang="en" controlledVocabularyID="1" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Natural Sciences</r:Subject>
        <r:Subject xml:lang="sv" controlledVocabularyID="1" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Naturvetenskap</r:Subject>
        <r:Subject xml:lang="en" controlledVocabularyID="106" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Biological Sciences</r:Subject>
        <r:Subject xml:lang="sv" controlledVocabularyID="106" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Biologi</r:Subject>
        <r:Subject xml:lang="en" controlledVocabularyID="10604" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Cell Biology</r:Subject>
        <r:Subject xml:lang="sv" controlledVocabularyID="10604" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Cellbiologi</r:Subject>
        <r:Subject xml:lang="en" controlledVocabularyID="10606" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Microbiology</r:Subject>
        <r:Subject xml:lang="sv" controlledVocabularyID="10606" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Mikrobiologi</r:Subject>
        <r:Subject xml:lang="en" controlledVocabularyID="30108" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Cell and Molecular Biology</r:Subject>
        <r:Subject xml:lang="sv" controlledVocabularyID="30108" controlledVocabularyName="Standard för svensk indelning av forskningsämnen 2025">Cell- och molekylärbiologi</r:Subject>
        <r:Keyword xml:lang="en" controlledVocabularyID="5218" controlledVocabularyName="GEMET">microbiology</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="5218" controlledVocabularyName="GEMET">mikrobiologi</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="5230" controlledVocabularyName="GEMET">microscopy</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="5230" controlledVocabularyName="GEMET">interferometri</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="21311" controlledVocabularyName="EnvThes">bacterial growth</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="20662" controlledVocabularyName="EnvThes">bacteria</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="20568" controlledVocabularyName="EnvThes">heterotrophic bacteria</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="20714" controlledVocabularyName="EnvThes">bacterial community composition</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="20018" controlledVocabularyName="EnvThes">image analysis</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p27501" controlledVocabularyName="YSO">optical microscopy</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p27501" controlledVocabularyName="YSO">ljusmikroskopi</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p13507" controlledVocabularyName="YSO">microbiology</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p13507" controlledVocabularyName="YSO">mikrobiologi</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p21846" controlledVocabularyName="YSO">machine learning</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p21846" controlledVocabularyName="YSO">maskininlärning</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p16290" controlledVocabularyName="YSO">microscopy</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p16290" controlledVocabularyName="YSO">mikroskopi</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p13019" controlledVocabularyName="YSO">Python (programming languages)</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p13019" controlledVocabularyName="YSO">Python</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p16870" controlledVocabularyName="YSO">image analysis</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p16870" controlledVocabularyName="YSO">bildanalys</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="p1749" controlledVocabularyName="YSO">bacteria</r:Keyword>
        <r:Keyword xml:lang="sv" controlledVocabularyID="p1749" controlledVocabularyName="YSO">bakterier</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="39084" controlledVocabularyName="NASA Thesaurus">bacteria</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="62205" controlledVocabularyName="NASA Thesaurus">image analysis</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="46773" controlledVocabularyName="NASA Thesaurus">machine learning</r:Keyword>
        <r:Keyword xml:lang="en" controlledVocabularyID="47420" controlledVocabularyName="NASA Thesaurus">microbiology</r:Keyword>
      </r:TopicalCoverage>
      <r:SpatialCoverage />
    </r:Coverage>
    <a:Archive>
      <r:URN>urn:ddi:se.researchdata:2023-202.Archive:2.0</r:URN>
      <a:ArchiveSpecific>
        <a:Item>
          <a:Access>
            <r:URN>urn:ddi:se.researchdata:2023-202.Archive-ArchiveSpecificType-AccessType:2.0</r:URN>
            <a:TypeOfAccess controlledVocabularyName="info:eu-repo-Access-Terms vocabulary">openAccess</a:TypeOfAccess>
          </a:Access>
          <a:DataFileQuantity>4</a:DataFileQuantity>
        </a:Item>
      </a:ArchiveSpecific>
    </a:Archive>
  </s:StudyUnit>
</ddi:DDIInstance>