Dataset med annoteringar av tekniskt språk från fyra års tillståndsövervakning av pappersmaskinsindustri i norra Sverige
https://doi.org/10.5878/hafd-ms27
Detta dataset består av tekniskt-språk-annoteringar från fyra års insamling från två pappersmaskiner i norra Sverige, strukturerat som en Pandas dataframe. Samma data finns också tillgänglig som en semikolonseparerad .csv-fil. Datan består av två kolumner, där den första kolumnen motsvarar annoteringens textinnehåll, och den andra titeln. Annoteringarna är skrivna på svenska, och processade så att alla egennamn ersatts av textsträngen ’egennamn’. Varje rad motsvarar en annotering med titel.
Data behandlas i Python med:
import pandas as pd
annotations_df = pd.read_pickle("Technical_Language_Annotations.pkl")
annotation_contents = annotations_df['noteComment']
annotation_titles = annotations_df['title']
Citering och åtkomst
Citering och åtkomst
Tillgänglighetsnivå:
Skapare/primärforskare:
Forskningshuvudman:
Diarienummer hos huvudman:
- 2019-02533
Data innehåller personuppgifter:
Ja
Typ av personuppgifter:
Signerade annoteringar förekommer i bevarade rådata. Datasetet innehåller därmed pseudonymiserade personuppgifter.
Citering:
Språk:
Korpus
Korpus
Avsedd användning:
Språkteknologiskt datorprogram, Mänsklig användning
Textdel
Textdel
Antal språk:
Enspråkig
Språk:
Svenska (swe)
Tekniskt Språk (Jargong)
:
Modalitet:
Skriftspråk
Storlek:
Poster: 2385
Uttryck: 1613
Typ av uppmärkning:
Entitetsomnämnanden
Automatisk
Övrigt
Länk till andra media:
Metod och utfall
Metod och utfall
Tidsperiod(er) som undersökts:
Geografisk täckning
Geografisk täckning
Geografisk plats:
Geografisk beskrivning:
Norrland
Administrativ information
Administrativ information
Ansvarig institution/enhet:
Institutionen för system- och rymdteknik
Medverkande:
- Peter Wikström - SCA Munksund
- Håkan Sirkka - Smurfit Kappa
- Pär-Erik Martinsson - Luleå tekniska universitet - Institutionen för system- och rymdteknik
- Kjell Lundberg - Smurfit Kappa
- Per-Erik Larsson - Svenska Kullagerfabriken
- Smurfit Kappa
Finansiering
Finansiering
Finansiär:
- Verket för innovationssystem
Öppnar nytt fönster hos ror.org.
RORÖppnas i en ny tabb
Referensnummer:
2019-02533
Projektnamn på ansökan:
Kunskapsintegrering för klassificering av maskinskador
Information om finansiering:
https://www.vinnova.se/p/kunskapsintegrering-for-klassificering-av-maskinskador/
Ämnesområde och nyckelord
Ämnesområde och nyckelord
Standard för svensk indelning av forskningsämnen 2025:
Relationer
Relationer
Hemsida:
Relaterade forskningsdata:
Publikationer
Publikationer
Citering:
Löwenmark, K., Taal, C., Nivre, J., Liwicki, M., & Sandin, F. (2022). Processing of Condition Monitoring Annotations with BERT and Technical Language Substitution: A Case Study. In Proceedings of the 7th European Conference of the Prognostics and Health Management Society 2022 (pp. 306–314).
Metadata
Metadata
Version 1

Luleå tekniska universitet