Dataset med tillståndsövervakningsvibrationsdata annoterat med tekniskt språk, från pappersmaskinsindustri i norra Sverige
https://doi.org/10.5878/hxc0-bd07
Industridataset med labels är bland de mest värdefulla tillgångarna att tillgå inom prognostik- och tillståndsövervaknings-forskning. Att tillverka labellade dataset är både svårt och dyrt, vilket medför att allmänt tillgängliga industridataset är sällsynta, särskilt de med labels. Studier har dock visat att industriannoteringar kan användas för att träna AI-modeller direkt på industridata ( https://doi.org/10.36001/ijphm.2022.v13i2.3137Öppnas i en ny tabb , https://doi.org/10.36001/phmconf.2023.v15i1.3507Öppnas i en ny tabb ), men trots att många industridataset innehåller de nödvändiga texterna så är få, om ens några, sådana dataset allmänt tillgängliga.
Därför ger vi ut ett dataset innehållandes annoterade signaldata från två stora (80x10x10m) pappersmaskiner från ett pappersbruk i norra Sverige. Datan består av 21 090 par av signaler och annoteringar från ett års produktion. Annoteringarna är skrivna på svenska av experter på plats, och signalerna består huvudsakligen av accelerometervibrationsmätningar från de två maskinerna.
Datasetet består av ett års annoterade vibrationsensormätningar från två pappersmaskiner, strukturerade som en Pandas dataframe och serialiserade som en pickle-fil (.pkl) samt en JSON-fil (.json). Den första kolumnen (’id’) är ID per sample; den andra kolumnen (’Spectra’) är fast-Fourier-transformerade och envelope-transformerade vibrationssignaler; den tredje kolumnen (’Notes’) är de tillhörande annoteringarna, kartlagda så att varje annotering är kopplad till alla signaler från tio dagar före annoteringsdatumet upp till annoteringsdatumet; och slutligen den fjärde kolumnen (’Embeddings’) är förberäknade text-representationer från Swedish SentenceBERT. Varje rad motsvarar ett vibrationsmätningsprov, även om det inte finns någon åtskillnad i denna data mellan vilken sensor och maskindel varje mätning kommer från.
Citering och åtkomst
Citering och åtkomst
Tillgänglighetsnivå:
Skapare/primärforskare:
Forskningshuvudman:
Diarienummer hos huvudman:
- 2019-02533
Data innehåller personuppgifter:
Ja
Typ av personuppgifter:
Signerade annoteringar förekommer i bevarade rådata. Datasetet innehåller därmed pseudonymiserade personuppgifter.
Citering:
Licens:
Datainsamling - Inspelning
Datainsamling - Inspelning
Insamlingsmetod:
Inspelning
Beskrivning av insamlingsmetod:
Vibrationsdata insamlad med accelerometrar (SKF IMx-system med CMSS-sensorer)
Datainsamlare:
- Luleå tekniska universitet
Öppnar nytt fönster hos ror.org.
RORÖppnas i en ny tabb
Datakälla:
- Fysiska föremål
Instrument
Instrument
Namn:
SKF CMSS 2200
Beskrivning av instrument:
https://www.skf.com/ph/productinfo/productid-CMSS%202200
Namn:
SKF CMSS 2207
Beskrivning av instrument:
https://www.skf.com/ph/productinfo/productid-CMSS%202207
Geografisk täckning
Geografisk täckning
Geografisk plats:
Administrativ information
Administrativ information
Ansvarig institution/enhet:
Institutionen för system- och rymdteknik
Övriga forskningshuvudmän:
Medverkande:
- Peter Wikström - SCA Munksund
- Kjell Lundberg - Smurfit Kappa
- Per-Erik Larsson - Svenska Kullagerfabriken
- Pär-Erik Martinsson - Luleå tekniska universitet - Institutionen för system- och rymdteknik
- Håkan Sirkka - Smurfit Kappa
- Smurfit Kappa
Finansiering
Finansiering
Finansiär:
- Verket för innovationssystem
Öppnar nytt fönster hos ror.org.
RORÖppnas i en ny tabb
Referensnummer:
2019-02533_Vinnova
Projektnamn på ansökan:
Kunskapsintegrering för klassificering av maskinskador
Information om finansiering:
Knowledge integration for fault severity estimation
Finansiär:
- Luleå tekniska universitet
Öppnar nytt fönster hos ror.org.
RORÖppnas i en ny tabb
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Relationer
Relationer
Hemsida:
Relaterade forskningsdata:
Publikationer
Publikationer
Citering:
Löwenmark, K. (2023). Technical Language Supervision for Intelligent Fault Diagnosis [Licentiate thesis]. Luleå University of Technology.
ISBN:
9789180482547
Citering:
Löwenmark, K., Taal, C., Nivre, J., Liwicki, M., & Sandin, F. (2022). Processing of Condition Monitoring Annotations with BERT and Technical Language Substitution: A Case Study. In Proceedings of the 7th European Conference of the Prognostics and Health Management Society 2022 (pp. 306–314).
Citering:
Löwenmark, K., Taal, C., Vurgaft, A., Liwicki, M., Nivre, J., & Sandin, F. (2023). Labelling of annotated condition monitoring data through technical language processing.
Citering:
Löwenmark, K., Taal, C., Schnabel, S., Liwicki, M., & Sandin, F. (2022). Technical Language Supervision for Intelligent Fault Diagnosis in Process Industry. In International Journal of Prognostics and Health Management (Vol. 13, Issue 2).
Versioner
Versioner
Version:
2
Metadata korrigerade:
Uppdaterat tillgänglighetsstatus till begränsad åtkomst
Publicerad:
Metadata
Metadata
Versioner
Versioner
Version:
2
Metadata korrigerade:
Uppdaterat tillgänglighetsstatus till begränsad åtkomst
Publicerad:

Luleå tekniska universitet