Imported Post 2026-04-20 00:16:50

Event-Ausrichtung: CMMS-Failure-Tickets mit SCADA-Zeitachsen abgleichen (± Minuten). Geplante Wartung nicht als „Ausfall“ labeln.
Maintenance-Reset: Nach Tausch/Generalüberholung Basislinie und Modellzustand zurücksetzen oder neu kalibrieren.
Health-Index: Aus Feature-Set mittels PCA/ICA oder domain-spezifisch (Energiebänder) einen monotonen Degradationsindex bauen; für RUL notwendig.
Zensierte Daten: Viele Einheiten erreichen Beobachtungsende ohne Ausfall (rechtszensiert) – Survival-Modelle können das, Standardregressionen nicht.

6) Bewertung und Betriebsmetriken

Anomalieerkennung:
False Alarms/Asset/24h (Operations-KPI).
Time-to-detect vor einem bestätigten Ausfall (z. B. Median 72 h).
Precision@k pro Wartungsfenster (welche N Alarme pro Woche führen zu echter Maßnahme?).
Downtime-Vermeidung in Stunden im Rückblick (nur mit sauberem Baseline-Vergleich).
RUL:
RMSE/MAE in Stunden bis Ausfall.
Asymmetrische Kostenfunktion (spätes vs. frühes Handeln), z. B. NASA s-score-artig, um zu späte Prognosen härter zu bestrafen.
Kalibrierung: Prognostizierte vs. tatsächliche Restzeit in Quantilen; Über-/Unterconfidence.

Tradeoffs: Was man gewinnt – und was man dafür aufgibt

Anomalie: Benötigt „gesunde“ Daten über Betriebszustände, wenige Ausfälle reichen für Verifikation.

RUL: Benötigt viele Run-to-Failure-Kurven je Fehlermechanismus und Asset-Familie; andernfalls Overfitting.

Anomalie: Feature-basierte Methoden sind gut erklärbar (welches Band, welcher Trend).

RUL: Deep-Modelle oft Blackbox; Survival-Modelle mit Kovariaten interpretierbar.

Anomalie: Eignet sich für Ampellogik, „Check at next stop/shift“. Geringere Planungspräzision, aber schnell implementierbar.

RUL: Bessere Planungspräzision, wenn Ersatzteile/Slots knapp; aber nur zuverlässig mit stabiler Datenbasis.

Edge-Inferenz spart Bandbreite und reagiert unter 100 ms; ideal bei hochfrequenten Signalen.

On-Prem vermeidet Cloud-Abhängigkeit, senkt Angriffsfläche, erleichtert DSGVO/IT-Sec in der Produktion. Dafür braucht es internes Betriebsteam und Lifecycle-Management.

Häufige Wartungen/Retrofits erzeugen Konzeptdrift; Anomalie-basierte Systeme lassen sich schneller rekalibrieren.

RUL-Modelle müssen bei Designänderungen der Komponenten neu validiert werden; Transferlernen nur begrenzt stabil.

Praxis: Szenarien aus Fertigung und Bahn

Textilfertigung: Spindellager und Webmaschinen

Ausgangslage: Mehrere Linien mit tausenden Spindeln. Ausfälle an Spindellagern führen zu Qualitätsverlust und Linienstopps. MTBF pro Lager im Bereich 1–3 Jahre, aber Ausfallereignisse verteilt und selten pro Linie.

Sensorik: 3-Achsen-Vibration an Lagerböcken (10–12 kHz), Temperatur an Gehäusen (1 Hz). Drehzahl verfügbar aus Antriebssteuerung.

Modellansatz: Anomalieerkennung. Feature-Vektor pro 1 s Fenster: RMS, Kurtosis, Crest-Faktor, Energiebänder um BPFO/BPFI, Hüllkurven-FFT-Peaks. Multivariate Mahalanobis-Distanz mit adaptivem EWMA-Baseline pro Spindel und Drehzahlband. Zusätzlich Change-Point-Detektion auf dem Health-Index.

Betrieb: Inferenz am Edge-IPC, Aggregation zu 1-Minuten-Scores. Über Kafka an on-prem Timeseries, Dashboarding, und Ticket-Autoerstellung im CMMS, wenn Score > Schwelle in 3 aufeinanderfolgenden Intervallen und die Linie in einem definierten „Inspektionsfenster“ ist.

Ergebnis in der Praxis: Frühwarnzeiten typischerweise 3–7 Tage vor einem bestätigten Lagerproblem, mit einer Fehlalarmrate <0,2/Tag/Linie nach Einführung von Drehzahlbändern und Wartungs-Resets. RUL wurde verworfen – zu wenig homogene Run-to-Failure-Verläufe je Lagertyp und Schmierzustand.

Bahn: HVAC-Kompressoren und Lüfter in EMUs

Ausgangslage: Flottenbetrieb mit verteilten Depots. Ungeplante Kompressorausfälle führen zu Fahrzeugtausch/Verspätung. Ersatzteile vorhanden, aber Depot-Slots begrenzt.

Sensorik: Stromsignatur (2 kHz) und Vibrationssensoren (6 kHz) an Kompressoreinheiten; Zustände (Ein/Aus, Last) aus dem Fahrzeugbus. Daten werden am Fahrzeug zwischengespeichert und bei Depotankunft synchronisiert (on-prem Server).

Modellansatz: Anomalieerkennung mit stromsignaturbasierten Merkmalen (Harmonische, THD, Lastübergänge), kombiniert mit Vibrations-RMS und Bandenergie. Isolation Forest auf multivariaten Features, plus Schwellenregeln für plötzliche Lastwechsel-Anomalien.

Integration: Alarm erzeugt automatisch einen Prüfungsvorgang im Flotten-CMMS; Techniker bestätigen/klassifizieren Befunde per Mobile-App, diese Labels fließen zurück in die Modellkalibrierung. Keine Cloud-Abhängigkeit; Fahrzeug-zu-Depot Sync via gesicherter WLAN-Zone. (→ alpitype.de/leistungen/)

Ergebnis in der Praxis: Deutlich weniger Überraschungsausfälle; „Next-Depot“-Interventionen wurden planbar. RUL wurde evaluiert, aber wegen geringer Ausfallzahlen pro Kompressortyp und variabler Einsatzprofile als zu unsicher verworfen.

Textil: Kalanderwalzen-Verschleiß – wo RUL funktioniert

Ausgangslage: Kalanderwalzen verschleißen reproduzierbar abhängig von Laufzeit, Temperatur und Materialmix. Austausch ist teuer, aber planbar.

Daten: Temperaturverlauf (1 Hz), Druck/Last, Laufzeit- und Chargenlogs, visuelle Qualitätsprüfung als weiches Label.

Modellansatz: Survival-Analyse mit Weibull-Basismodell und Kovariaten (mittlere Betriebstemperatur, Last, Produktmix), Health-Index aus Oberflächenrauheit/Qualitätsmetriken. Umgang mit zensierten Daten (Walzen, die am Beobachtungsende noch laufen).

Betrieb: RUL-Ausgabe in Stunden/Nutzungszyklen, mit Konfidenzintervallen. Planung von Walzenwechseln bei 70–85% erwarteter Lebensdauer, abhängig von Ersatzteil-Leadtime.

Ergebnis: Ersatzteil- und Schichtplanung verbesserten sich messbar; hier war die Homogenität des Verschleißprozesses der Schlüssel.

Rail: Türantriebe – Mischstrategie

Ausgangslage: Häufige, aber nicht-kritische Störungen an Türantrieben. Ausfälle korrelieren mit Temperatur und Nutzungsspitzen (HVZ).

Ansatz: Kombination. Anomalieerkennung detektiert Abweichungen in Strom-/Zeitprofilen einzelner Öffnungszyklen; ein einfaches RUL-Modell (log-linearer Trend eines Health-Index) liefert grobe Restlebensdauerschätzungen für Flottenpriorisierung. Alerts werden nur ausgelöst, wenn beide Signale im kritischen Bereich liegen oder wenn Anomaliescores wiederholt ansteigen.