Trade-offs: Was man gewinnt und was man opfert

  • Datenbedarf:
  • Anomalie: Startet mit Normaldaten, braucht gute Modus-Trennung; wenig Labeling, aber Driftmanagement ist Pflicht.
  • RUL: Braucht verlässliche Labels oder physiknahe Indikatoren; Censoring handhaben; Daten über lange Zeiträume.
  • Actionability:
  • Anomalie: Führt zu Inspektion; gut bei hohem Sicherheitsanspruch und schwer modellierbaren Modi.
  • RUL: Liefert Planbarkeit; sinnvoll bei teuren Stillständen und langen Lieferzeiten.
  • Interpretierbarkeit:
  • Klassische Features + Schwellwerte sind gut erklärbar; Deep-Modelle oft weniger.
  • State-Space-Modelle bieten physikalische Plausibilität und Unsicherheiten.
  • Betriebsumfeld:
  • Edge-Anomalie ist robust bei schlechter Konnektivität; RUL profitiert von Flottenaggregation und zentralem Wissen.
  • Wartbarkeit:
  • Anomalie: Regelmäßiges Re-Baselining je Saison/Modus.
  • RUL: Re-Kalibrierung bei neuen Komponentenlieferanten, Öl, Software-Updates, geänderter Einsatzprofile (Domain Shift).

Praxis: Was in Textilfertigung und Bahn funktioniert
1) Textil: Lager- und Getriebeschäden an Ringspinnmaschinen

  • Ausgangslage:
  • Häufige, aber unregelmäßige Lagerdefekte an Spindeln/Getrieben. Kaum Run-to-Failure, da präventive Wechsel im Turnus; CMMS-Einträge unpräzise (“Geräusch, Tausch”).
  • Vibrationserfassung initial mit 2 kHz, Temperatur 1 Hz; kein Tachometer.
  • Was nicht funktionierte:
  • Früher Versuch mit RUL auf trendenden RMS-Werten: RMS war last- und chargenabhängig, nicht monoton. RUL wandelte mit Schichtmustern, MAE unbrauchbar.
  • Was funktionierte:
  • Sensorik auf 12 kHz erhöht, Hüllkurvenanalyse um Lagerkennfrequenzen; einfache Tachometrie via optischem Marker an der Hauptwelle für Ordnungsanalyse.
  • Feature-Set pro Modus (Drehzahlband, Materialcharge): Bandenergien um BPFO/BPFI, Seitenbandverhältnisse, Kurtosis der Hüllkurve.
  • Semi-supervised: One-Class SVM pro Maschine+Modus, initiiert aus 4 Wochen Normalbetrieb. Score-Glättung über EWMA; Alarm nur, wenn Score 3 Mal in Folge über adaptivem Schwellenwert.
  • Integration: Alarm erzeugt automatisch Inspektionsauftrag im CMMS mit Top-N Frequenzbändern und Spektrums-Snapshot. Befundergebnis (z. B. “Innenring Pittings, 2/5 Schweregrad”) wird als Label gespeichert.
  • Ergebnis (qualitativ):
  • Alarme reduziert auf <1 pro 500 Betriebsstunden und Maschine bei gleicher Sensitivität.
  • Verkürzte Diagnosezeit durch Frequenzhinweise.
  • Nach 6–9 Monaten ausreichend gelabelte Ereignisse, um für häufige Lagerbaugrößen einfache Degradationsindizes zu trendieren. RUL blieb weiterhin nachrangig, da Wechsel im Turnus dominiert.

2) Bahn: Schwenkschiebetüren – Intermittente Störungen

  • Ausgangslage:
  • Türsysteme fallen sporadisch aus (Eis, Verschleiß, Limit-Switch-Probleme). Sensordaten: Motorstrom, Position, Geschwindigkeit, Umgebungstemp. Laufprofile stark variabel (Stationen, Wetter).
  • Viele Serviceeinsätze, aber selten echter “Verschleiß bis Null”.
  • Was nicht funktionierte:
  • RUL-Ansatz mit Strom-Rampenzeit als Indikator: Nicht monoton, stark wetter- und belastungsabhängig. Cox-Modelle mit schwacher Proportionalität, schlechte Kalibrierung.
  • Was funktionierte:
  • Zustandsbasierte Anomalie:
  • Modusdetektion: Öffnen, Schließen, Blockierungstest; jeweils eigene Feature-Extraktion (Anstiegszeit, Spitzenstrom, Energie pro Zyklus, Segmentierte RMS).
  • Sequence-Autoencoder pro Modus auf Stichprobenzylken; Isolation Forest auf Zyklusaggregaten.
  • Kontext: Temperatur und Niederschlagsindikator als exogene Kovariaten in der Schwellenwertlogik (saisonal adaptive Baselines).
  • Edge-Inferenz an der Türsteuerung; Pufferung bei Funklöchern. Nur Features/Anomaliescores werden zentral synchronisiert.
  • CMMS-Integration: Wenn 3 Anomalien innerhalb 100 Zyklen, generiere Inspektion bei nächster Wende; Protokolliere Sensorauszug.
  • Ergebnis (qualitativ):
  • Spürbar weniger Fehlauslösungen; verpasste Alarme selten und primär bei abrupten Sensorfehlern.
  • RUL wurde bewusst verworfen; Action ist Inspektion, nicht Tausch auf Termin.

3) Bahn: Traktionslager – Planbarkeit mit Degradationsindex

  • Ausgangslage:
  • Traktionslager zeigen längerfristigen Verschleiß; Stillstände kosten. Flotte mit vergleichbaren Achsantrieben, akzeptable Sensorik (Vibration 20 kHz, Tachometer, Öltemperatur).
  • Gute Wartungshistorie mit Tauschdaten, allerdings zensiert (viele präventive Wechsel).
  • Ansatz:
  • Physiknahe Feature-Pipeline: Hüllkurvenbandenergien an BPFO/BPFI/FTF, Seitenbandprogression, Ordnungsanalyse drehzahlnormalisiert.
  • Health Index H(t): gewichtete Kombination der monotonen Features, pro Modus normalisiert; Zwang zur Monotonie per isotonic regression der Verlaufskurven.
  • RUL-Modell:
  • Bayesian State-Space: Latente Health-Variable mit driftender Dynamik; Messmodell an H(t), Unsicherheit explizit.
  • Kalibrierung mit zensierten Daten via Survival-Likelihood; Prioren auf Degradationsrate je Baureihe.
  • Entscheidungslogik:
  • Wenn RUL-Intervall 80 % < 500 h: Ersatzteil bestellen.
  • Wenn RUL-Median < nächste HU + 200 h: Slot umbuchen.
  • Ergebnis (qualitativ):
  • Sinnvolle Planbarkeit; akzeptierte Unsicherheiten durch Intervallangabe.
  • Vor-Ort-Edge führt nur Feature-Extraktion durch; RUL-Rechnung zentral on-prem, Flottenvergleich inklusive.

Edge vs. Cloud: Realitäten im industriellen Feld

  • Bahn:
  • Konnektivität ist unzuverlässig; Edge-Inferenz für Tür-/Antriebsdaten ist Pflicht. Puffer und opportunistische Synchronisation.
  • Sicherheitsdomänen trennen: Diagnosedaten isoliert vom Steuerkreis, aber Zeitstempel-Synchronität via PTP/NTP sicherstellen.
  • Textil:
  • Hallenweite Edge-Gateways verbinden Maschinen (OPC UA) mit on-prem-Cluster. Rohvibration wird lokal verarbeitet; nur Features und Ereignisse in Timeseries-DB.
  • Souveränität:
  • Kein US-Cloud-Zwang, DSGVO-konform. Modelle und Daten on-prem, Updates signiert ausgerollt. Auditierbare Entscheidungslogik für Instandhaltung.
  • Wenn Sie Unterstützung beim Aufbau einer solchen On-Prem-Architektur suchen: (→ alpitype.de/leistungen/)