- Event-Ausrichtung: CMMS-Failure-Tickets mit SCADA-Zeitachsen abgleichen (± Minuten). Geplante Wartung nicht als „Ausfall“ labeln.
- Maintenance-Reset: Nach Tausch/Generalüberholung Basislinie und Modellzustand zurücksetzen oder neu kalibrieren.
- Health-Index: Aus Feature-Set mittels PCA/ICA oder domain-spezifisch (Energiebänder) einen monotonen Degradationsindex bauen; für RUL notwendig.
- Zensierte Daten: Viele Einheiten erreichen Beobachtungsende ohne Ausfall (rechtszensiert) – Survival-Modelle können das, Standardregressionen nicht.
6) Bewertung und Betriebsmetriken
- Anomalieerkennung:
- False Alarms/Asset/24h (Operations-KPI).
- Time-to-detect vor einem bestätigten Ausfall (z. B. Median 72 h).
- Precision@k pro Wartungsfenster (welche N Alarme pro Woche führen zu echter Maßnahme?).
- Downtime-Vermeidung in Stunden im Rückblick (nur mit sauberem Baseline-Vergleich).
- RUL:
- RMSE/MAE in Stunden bis Ausfall.
- Asymmetrische Kostenfunktion (spätes vs. frühes Handeln), z. B. NASA s-score-artig, um zu späte Prognosen härter zu bestrafen.
- Kalibrierung: Prognostizierte vs. tatsächliche Restzeit in Quantilen; Über-/Unterconfidence.
Tradeoffs: Was man gewinnt – und was man dafür aufgibt
- Datenanforderung:
- Anomalie: Benötigt „gesunde“ Daten über Betriebszustände, wenige Ausfälle reichen für Verifikation.
- RUL: Benötigt viele Run-to-Failure-Kurven je Fehlermechanismus und Asset-Familie; andernfalls Overfitting.
- Interpretierbarkeit:
- Anomalie: Feature-basierte Methoden sind gut erklärbar (welches Band, welcher Trend).
- RUL: Deep-Modelle oft Blackbox; Survival-Modelle mit Kovariaten interpretierbar.
- Operative Einbindung:
- Anomalie: Eignet sich für Ampellogik, „Check at next stop/shift“. Geringere Planungspräzision, aber schnell implementierbar.
- RUL: Bessere Planungspräzision, wenn Ersatzteile/Slots knapp; aber nur zuverlässig mit stabiler Datenbasis.
- Latenz/Compute:
- Edge-Inferenz spart Bandbreite und reagiert unter 100 ms; ideal bei hochfrequenten Signalen.
- Zentralisierte Analysen brauchen mehr Transport, bieten aber Flottenvergleiche.
- Datensouveränität/Compliance:
- On-Prem vermeidet Cloud-Abhängigkeit, senkt Angriffsfläche, erleichtert DSGVO/IT-Sec in der Produktion. Dafür braucht es internes Betriebsteam und Lifecycle-Management.
- Lebenszyklus/Änderungsmanagement:
- Häufige Wartungen/Retrofits erzeugen Konzeptdrift; Anomalie-basierte Systeme lassen sich schneller rekalibrieren.
- RUL-Modelle müssen bei Designänderungen der Komponenten neu validiert werden; Transferlernen nur begrenzt stabil.
Praxis: Szenarien aus Fertigung und Bahn
Textilfertigung: Spindellager und Webmaschinen
- Ausgangslage: Mehrere Linien mit tausenden Spindeln. Ausfälle an Spindellagern führen zu Qualitätsverlust und Linienstopps. MTBF pro Lager im Bereich 1–3 Jahre, aber Ausfallereignisse verteilt und selten pro Linie.
- Sensorik: 3-Achsen-Vibration an Lagerböcken (10–12 kHz), Temperatur an Gehäusen (1 Hz). Drehzahl verfügbar aus Antriebssteuerung.
- Modellansatz: Anomalieerkennung. Feature-Vektor pro 1 s Fenster: RMS, Kurtosis, Crest-Faktor, Energiebänder um BPFO/BPFI, Hüllkurven-FFT-Peaks. Multivariate Mahalanobis-Distanz mit adaptivem EWMA-Baseline pro Spindel und Drehzahlband. Zusätzlich Change-Point-Detektion auf dem Health-Index.
- Betrieb: Inferenz am Edge-IPC, Aggregation zu 1-Minuten-Scores. Über Kafka an on-prem Timeseries, Dashboarding, und Ticket-Autoerstellung im CMMS, wenn Score > Schwelle in 3 aufeinanderfolgenden Intervallen und die Linie in einem definierten „Inspektionsfenster“ ist.
- Ergebnis in der Praxis: Frühwarnzeiten typischerweise 3–7 Tage vor einem bestätigten Lagerproblem, mit einer Fehlalarmrate <0,2/Tag/Linie nach Einführung von Drehzahlbändern und Wartungs-Resets. RUL wurde verworfen – zu wenig homogene Run-to-Failure-Verläufe je Lagertyp und Schmierzustand.
Bahn: HVAC-Kompressoren und Lüfter in EMUs
- Ausgangslage: Flottenbetrieb mit verteilten Depots. Ungeplante Kompressorausfälle führen zu Fahrzeugtausch/Verspätung. Ersatzteile vorhanden, aber Depot-Slots begrenzt.
- Sensorik: Stromsignatur (2 kHz) und Vibrationssensoren (6 kHz) an Kompressoreinheiten; Zustände (Ein/Aus, Last) aus dem Fahrzeugbus. Daten werden am Fahrzeug zwischengespeichert und bei Depotankunft synchronisiert (on-prem Server).
- Modellansatz: Anomalieerkennung mit stromsignaturbasierten Merkmalen (Harmonische, THD, Lastübergänge), kombiniert mit Vibrations-RMS und Bandenergie. Isolation Forest auf multivariaten Features, plus Schwellenregeln für plötzliche Lastwechsel-Anomalien.
- Integration: Alarm erzeugt automatisch einen Prüfungsvorgang im Flotten-CMMS; Techniker bestätigen/klassifizieren Befunde per Mobile-App, diese Labels fließen zurück in die Modellkalibrierung. Keine Cloud-Abhängigkeit; Fahrzeug-zu-Depot Sync via gesicherter WLAN-Zone. (→ alpitype.de/leistungen/)
- Ergebnis in der Praxis: Deutlich weniger Überraschungsausfälle; „Next-Depot“-Interventionen wurden planbar. RUL wurde evaluiert, aber wegen geringer Ausfallzahlen pro Kompressortyp und variabler Einsatzprofile als zu unsicher verworfen.
Textil: Kalanderwalzen-Verschleiß – wo RUL funktioniert
- Ausgangslage: Kalanderwalzen verschleißen reproduzierbar abhängig von Laufzeit, Temperatur und Materialmix. Austausch ist teuer, aber planbar.
- Daten: Temperaturverlauf (1 Hz), Druck/Last, Laufzeit- und Chargenlogs, visuelle Qualitätsprüfung als weiches Label.
- Modellansatz: Survival-Analyse mit Weibull-Basismodell und Kovariaten (mittlere Betriebstemperatur, Last, Produktmix), Health-Index aus Oberflächenrauheit/Qualitätsmetriken. Umgang mit zensierten Daten (Walzen, die am Beobachtungsende noch laufen).
- Betrieb: RUL-Ausgabe in Stunden/Nutzungszyklen, mit Konfidenzintervallen. Planung von Walzenwechseln bei 70–85% erwarteter Lebensdauer, abhängig von Ersatzteil-Leadtime.
- Ergebnis: Ersatzteil- und Schichtplanung verbesserten sich messbar; hier war die Homogenität des Verschleißprozesses der Schlüssel.
Rail: Türantriebe – Mischstrategie
- Ausgangslage: Häufige, aber nicht-kritische Störungen an Türantrieben. Ausfälle korrelieren mit Temperatur und Nutzungsspitzen (HVZ).
- Ansatz: Kombination. Anomalieerkennung detektiert Abweichungen in Strom-/Zeitprofilen einzelner Öffnungszyklen; ein einfaches RUL-Modell (log-linearer Trend eines Health-Index) liefert grobe Restlebensdauerschätzungen für Flottenpriorisierung. Alerts werden nur ausgelöst, wenn beide Signale im kritischen Bereich liegen oder wenn Anomaliescores wiederholt ansteigen.