Feature Engineering für Vibrations-, Temperatur- und Stromsignale in Predictive Maintenance: was in der Praxis wirklich trägt

Problem: Warum viele PdM-Pipelines schon am Rohsignal scheitern
Die meisten gescheiterten PdM-Projekte, die ich in Textilfertigung und Bahn gesehen habe, hatten kein Modellproblem, sondern ein Signalproblem. Typische Muster:

  • Falsche Abtastraten und Antialiasing: Lagerdiagnose wird mit 1 kHz gesampelt, Envelope-Detektion dann „zu laut“ – klar, weil die Schadfrequenzen jenseits der Nyquist-Frequenz liegen. Oder: kein analoges Antialias-Filter, dann sind alle Spektren „hübsch“, aber in Wahrheit alias-kontaminiert.
  • Falsche Dynamik: IEPE-Beschleunigungssensoren (100 mV/g) an 12-bit-ADCs mit 0–10 V Eingang. Eine kleine Defektamplitude von 0,005 g entspricht 0,5 mV – unterhalb der ca. 2,4 mV LSB-Stufe. Ergebnis: die frühen Signaturen sind schlicht quantisiert weg.
  • Montage und Massebezug: Vibrationen über magnetische Füße an lackierten Flächen „gemessen“. Die Resonanzen der Montage dominieren, nicht die Maschine. Dann wundert man sich, dass Features wandernd und instabil sind.
  • Kein Zustandsbezug: Features werden über Mischungen aus Drehzahlen, Lasten und Betriebsarten gebildet. Ohne Drehzahlsynchronisation (Order-Tracking) oder Segmentierung nach Lastzustand verschmiert die Signatur.
  • Timestamps ohne Synchronisation: Strom- und Vibrationsdaten aus unterschiedlichen Edge-Loggern kommen mit ungenauer Systemzeit. Korrelationen sind zufällig. Spätestens bei Root Cause Analysis wird’s beliebig.
  • Temperatur ohne Referenz: „Maschine wird warm“ ist trivial – was fehlt, ist der Abzug von Umgebungseinfluss und der Abgleich gegen baugleiche Referenzachsen. Ohne das sind Trends nicht interpretierbar.
  • Stromsignale mit Netzartefakten: Wir sehen „Seitenbänder“, die in Wahrheit aus Umrichter-Switching oder Netzoberschwingungen stammen – nicht vom Lagerschaden. Fehlalarme vorprogrammiert.

Kurz: Wer Rohdaten „in die Cloud“ kippt und direkt ein neuronales Netz erwartet, baut eine POC-Demo – aber kein wartbares, industrietaugliches System. In der Produktion gewinnt man Robustheit, indem man Domänenwissen vor das Modell stellt: saubere Erfassung, deterministische Vorverarbeitung, und Features, die sich unter wechselnden Betriebsbedingungen stabil verhalten.

Lösung: Eine robuste, feature-zentrierte Pipeline – vom Sensor bis zum Modell
Ich skizziere die Architektur, die wir in Textilmaschinen und im Fahrzeugbetrieb (Bahn) produktiv fahren. Ziel: reproduzierbare Features mit geringer Varianz bei Last- und Drehzahlschwankungen, geringe Edge-Last und klarer Pfad in CMMS/ERP.

1) Signalaufbau und Synchronisation

  • Sensorik
  • Vibration: IEPE/ICP-Beschleunigungssensoren 100 mV/g, Bandbreite ≥ 10 kHz mechanisch, feste Schraubmontage oder Klebebasis auf Metall, nicht magnetisch, definierte Richtung. Für Getriebe zusätzlich Körperschallmikrofone möglich.
  • Temperatur: PT100/thermische Fühler an relevanten Stellen (Lageraußenring, Wicklung nahe Statornut, Getriebegehäuse), aber immer gepaart mit Umgebungssensor (Referenz) und idealerweise Differenzmessung entlang des Wärmestroms.
  • Strom/Spannung: Klapp-Stromwandler oder Rogowski-Spulen mit Bandbreite bis einige kHz, ideal differenziell. Bei Umrichterbetrieb: interne Motorachsenströme bevorzugt, sonst Netzeinspeiseseite mit entsprechender Filterung.
  • Drehzahl/Tachometer: Phototacho, Hallsensor oder abgeleitet aus Antriebsregelung. Alternativ bei Bahn: Radsensor/TCN-Bus.

  • Erfassung
  • Abtastraten: Vibration typ. 12,8–51,2 kHz je nach erwarteter Schadfrequenz und Resonanzen. Strom: mind. einige kHz, abhängig von Polpaarzahl/Slipfrequenz; Temperatur: 1–10 Hz reicht meist.
  • Analoges Antialias-Filter vor ADC; 16-bit effektive Auflösung (ENOB) oder besser für Vibration.
  • Zeitbasis via IEEE 1588 PTP oder dedizierte NTP-Disziplinierung über das Produktionsnetz; alle Kanäle an dieselbe Domäne hängen.
  • Edge-Node
  • Industrieller x86/ARM-Rechner, Echtzeit-Kernel optional, Containerisierung (z. B. Podman) mit klaren Ressourcenlimits. Rohdaten werden nur kurz gehalten; persistiert werden Features, nicht Streams.
  • Watchdogs, Backpressure: Wenn Rechenlast steigt, wird die Rohsammlung gedrosselt, aber Feature-Zeitreihen bleiben deterministisch.

2) Vorverarbeitung pro Modus

  • Vibrationsdaten
  • Detrending, DC-Removal, ggf. Hochpass 2–10 Hz (je nach Anwendung) zur Entfernung von quasi-statischen Bewegungen.
  • Segmentierung in 1–2 s Fenster mit 50% Überlappung für allgemeine Maschinen; bei Bahn abhängig von Streckenabschnitt/Drehzahlfenster.
  • Falls Drehzahl variiert: resampling via Order-Tracking (Zeitachse in Winkelachse transformieren); sonst STFT mit Fensterung (Hann, mindestens 4× Linienbreitenauflösung).
  • Envelope-Detektion (Bandpass um Resonanzen des Lagers, z. B. 2–8 kHz; dann Hilbert-Hülle und Spektrum) für Wälzlager.
  • Spektrale Entzerrung, falls Sensor-/Montageresonanzen bekannt sind.

  • Stromsignale
  • Notch-Filter für Netzgrundfrequenz-Artefakte nur, wenn nicht Diagnoseziel; sonst bewusst beibehalten.
  • Park-Vektor-Transformation (α-β) zur Extraktion der negativen Sequenz; gleitende FFTs für Seitenbänder um f1, 2f1 etc. bei Umrichterbetrieb: Analyse in elektrischer Grundfrequenz statt 50 Hz.
  • RMS, Total Harmonic Distortion (THD), Seitenbandenergie bei f1 ± 2sf1 (s Slip), spezifische Seitenbänder für Rotorstab-/Exzentrizitätsfehler.
  • Temperatur
  • Tiefpass/Glättung, Trend-/Saisonalitätsmodell (Holt-Winters) gegen Umgebungs- und Tagesgang.
  • Residuenbildung: T_lager – T_ambient, Gradient dT/dt, zeitliche Konstanten bei Aufheizen/Abkühlen (aus Sprüngen extrahiert).
  • Vergleichsachsen (Zwillingslager) als Referenz-Feature: ΔT zwischen baugleichen Punkten.

3) Feature Engineering – konkret, stabil, zustandsbewusst
Vibration (zeitdomäne)

  • Mittelwert, RMS, Peak, Peak-to-Peak
  • Crest-Faktor (Peak/RMS) – reagiert früh auf impulsive Defekte
  • Kurtosis, Skewness – höherer Wert = impulsivere Struktur
  • Impulsfaktor, Formfaktor

Vibration (frequenz-/ordnungsdomäne)

  • Ordnungspegel O1, O2, On (unwucht, Fluchtfehler, Zahn-/Polpaar-getriebene Linien)
  • Seitenschulter-Metriken um Zahnrad-Mesh-Frequenzen (f_mesh und k·f_mesh ± n·f_rot)
  • Envelope-Spektrum-Peaks bei Lagerkennfrequenzen: BPFO, BPFI, BSF, FTF; Summenpegel in ±Δf-Bändern statt einzelne Bin-Maxima
  • Spektrale Kurtosis zur Bandselektion (wo impulsive Energie konzentriert)
  • Cepstrum-Peaks (Quefrency) zur Zahnradperiodizität (Zahnzahl-Perioden)

Stromaufnahme (MCSA)

  • RMS je Phase, Unwucht zwischen Phasen
  • THD und spezifische Ordnungen (5., 7., 11., 13. – je nach Antriebstopologie)
  • Negative-Sequence-Komponente (Unsymmetrie, z. B. Lagerschaden-induzierte mechanische Exzentrizität)
  • Seitenbandenergie um Grundfrequenz in Abständen der mechanischen Drehfrequenz (f1 ± k·f_mech) – Indikator für Luftspalt- oder Rotorprobleme
  • Spektrale Entropie als Globalmaß für Signalkomplexität unter Last