Trade-offs: Was man gewinnt und was man opfert
- Datenbedarf:
- Anomalie: Startet mit Normaldaten, braucht gute Modus-Trennung; wenig Labeling, aber Driftmanagement ist Pflicht.
- RUL: Braucht verlässliche Labels oder physiknahe Indikatoren; Censoring handhaben; Daten über lange Zeiträume.
- Actionability:
- Anomalie: Führt zu Inspektion; gut bei hohem Sicherheitsanspruch und schwer modellierbaren Modi.
- RUL: Liefert Planbarkeit; sinnvoll bei teuren Stillständen und langen Lieferzeiten.
- Interpretierbarkeit:
- Klassische Features + Schwellwerte sind gut erklärbar; Deep-Modelle oft weniger.
- State-Space-Modelle bieten physikalische Plausibilität und Unsicherheiten.
- Betriebsumfeld:
- Edge-Anomalie ist robust bei schlechter Konnektivität; RUL profitiert von Flottenaggregation und zentralem Wissen.
- Wartbarkeit:
- Anomalie: Regelmäßiges Re-Baselining je Saison/Modus.
- RUL: Re-Kalibrierung bei neuen Komponentenlieferanten, Öl, Software-Updates, geänderter Einsatzprofile (Domain Shift).
Praxis: Was in Textilfertigung und Bahn funktioniert
1) Textil: Lager- und Getriebeschäden an Ringspinnmaschinen
- Ausgangslage:
- Häufige, aber unregelmäßige Lagerdefekte an Spindeln/Getrieben. Kaum Run-to-Failure, da präventive Wechsel im Turnus; CMMS-Einträge unpräzise (“Geräusch, Tausch”).
- Vibrationserfassung initial mit 2 kHz, Temperatur 1 Hz; kein Tachometer.
- Was nicht funktionierte:
- Früher Versuch mit RUL auf trendenden RMS-Werten: RMS war last- und chargenabhängig, nicht monoton. RUL wandelte mit Schichtmustern, MAE unbrauchbar.
- Was funktionierte:
- Sensorik auf 12 kHz erhöht, Hüllkurvenanalyse um Lagerkennfrequenzen; einfache Tachometrie via optischem Marker an der Hauptwelle für Ordnungsanalyse.
- Feature-Set pro Modus (Drehzahlband, Materialcharge): Bandenergien um BPFO/BPFI, Seitenbandverhältnisse, Kurtosis der Hüllkurve.
- Semi-supervised: One-Class SVM pro Maschine+Modus, initiiert aus 4 Wochen Normalbetrieb. Score-Glättung über EWMA; Alarm nur, wenn Score 3 Mal in Folge über adaptivem Schwellenwert.
- Integration: Alarm erzeugt automatisch Inspektionsauftrag im CMMS mit Top-N Frequenzbändern und Spektrums-Snapshot. Befundergebnis (z. B. “Innenring Pittings, 2/5 Schweregrad”) wird als Label gespeichert.
- Ergebnis (qualitativ):
- Alarme reduziert auf <1 pro 500 Betriebsstunden und Maschine bei gleicher Sensitivität.
- Verkürzte Diagnosezeit durch Frequenzhinweise.
- Nach 6–9 Monaten ausreichend gelabelte Ereignisse, um für häufige Lagerbaugrößen einfache Degradationsindizes zu trendieren. RUL blieb weiterhin nachrangig, da Wechsel im Turnus dominiert.
2) Bahn: Schwenkschiebetüren – Intermittente Störungen
- Ausgangslage:
- Türsysteme fallen sporadisch aus (Eis, Verschleiß, Limit-Switch-Probleme). Sensordaten: Motorstrom, Position, Geschwindigkeit, Umgebungstemp. Laufprofile stark variabel (Stationen, Wetter).
- Viele Serviceeinsätze, aber selten echter “Verschleiß bis Null”.
- Was nicht funktionierte:
- RUL-Ansatz mit Strom-Rampenzeit als Indikator: Nicht monoton, stark wetter- und belastungsabhängig. Cox-Modelle mit schwacher Proportionalität, schlechte Kalibrierung.
- Was funktionierte:
- Zustandsbasierte Anomalie:
- Modusdetektion: Öffnen, Schließen, Blockierungstest; jeweils eigene Feature-Extraktion (Anstiegszeit, Spitzenstrom, Energie pro Zyklus, Segmentierte RMS).
- Sequence-Autoencoder pro Modus auf Stichprobenzylken; Isolation Forest auf Zyklusaggregaten.
- Kontext: Temperatur und Niederschlagsindikator als exogene Kovariaten in der Schwellenwertlogik (saisonal adaptive Baselines).
- Edge-Inferenz an der Türsteuerung; Pufferung bei Funklöchern. Nur Features/Anomaliescores werden zentral synchronisiert.
- CMMS-Integration: Wenn 3 Anomalien innerhalb 100 Zyklen, generiere Inspektion bei nächster Wende; Protokolliere Sensorauszug.
- Ergebnis (qualitativ):
- Spürbar weniger Fehlauslösungen; verpasste Alarme selten und primär bei abrupten Sensorfehlern.
- RUL wurde bewusst verworfen; Action ist Inspektion, nicht Tausch auf Termin.
3) Bahn: Traktionslager – Planbarkeit mit Degradationsindex
- Ausgangslage:
- Traktionslager zeigen längerfristigen Verschleiß; Stillstände kosten. Flotte mit vergleichbaren Achsantrieben, akzeptable Sensorik (Vibration 20 kHz, Tachometer, Öltemperatur).
- Gute Wartungshistorie mit Tauschdaten, allerdings zensiert (viele präventive Wechsel).
- Ansatz:
- Physiknahe Feature-Pipeline: Hüllkurvenbandenergien an BPFO/BPFI/FTF, Seitenbandprogression, Ordnungsanalyse drehzahlnormalisiert.
- Health Index H(t): gewichtete Kombination der monotonen Features, pro Modus normalisiert; Zwang zur Monotonie per isotonic regression der Verlaufskurven.
- RUL-Modell:
- Bayesian State-Space: Latente Health-Variable mit driftender Dynamik; Messmodell an H(t), Unsicherheit explizit.
- Kalibrierung mit zensierten Daten via Survival-Likelihood; Prioren auf Degradationsrate je Baureihe.
- Entscheidungslogik:
- Wenn RUL-Intervall 80 % < 500 h: Ersatzteil bestellen.
- Wenn RUL-Median < nächste HU + 200 h: Slot umbuchen.
- Ergebnis (qualitativ):
- Sinnvolle Planbarkeit; akzeptierte Unsicherheiten durch Intervallangabe.
- Vor-Ort-Edge führt nur Feature-Extraktion durch; RUL-Rechnung zentral on-prem, Flottenvergleich inklusive.
Edge vs. Cloud: Realitäten im industriellen Feld
- Bahn:
- Konnektivität ist unzuverlässig; Edge-Inferenz für Tür-/Antriebsdaten ist Pflicht. Puffer und opportunistische Synchronisation.
- Sicherheitsdomänen trennen: Diagnosedaten isoliert vom Steuerkreis, aber Zeitstempel-Synchronität via PTP/NTP sicherstellen.
- Textil:
- Hallenweite Edge-Gateways verbinden Maschinen (OPC UA) mit on-prem-Cluster. Rohvibration wird lokal verarbeitet; nur Features und Ereignisse in Timeseries-DB.
- Souveränität:
- Kein US-Cloud-Zwang, DSGVO-konform. Modelle und Daten on-prem, Updates signiert ausgerollt. Auditierbare Entscheidungslogik für Instandhaltung.
- Wenn Sie Unterstützung beim Aufbau einer solchen On-Prem-Architektur suchen: (→ alpitype.de/leistungen/)