In regulierten Industrien ist „Build vs Buy“ keine Glaubensfrage. Es ist eine Abwägung gegen klare, nicht verhandelbare Anforderungen. Wenn Datenhoheit, Auditierbarkeit, Offline-Fähigkeit, Latenz und OT-Integration dominieren, ist individuelle Entwicklung die einzige Option, die langfristig tragfähig ist. Nutzen Sie Standardkomponenten, aber behalten Sie die Zügel in der Hand: Architektur, Code, Betrieb. Souveränität ist die Voraussetzung dafür, dass KI nicht zum Risiko, sondern zum Hebel wird.
FAQ
1) Ist „Build“ nicht zu teuer und langsam im Vergleich zu „Buy“?
- Kurzfristig wirkt „Buy“ schneller. In regulierten Umgebungen entstehen aber Folgekosten durch Workarounds: Datenabflüsse schließen, Integrationshacks, Audit-Lücken, Vertragsabhängigkeiten. Ein sorgfältig geplanter Vertical Slice und eine stabile on-prem-Plattform amortisieren sich, weil sie Änderungen, Audits und Betrieb berechenbar machen.
2) Wie vermeiden wir Lock-in, wenn wir trotzdem Open-Source-Komponenten verwenden?
- Durch konsequente Entkopplung:
- Standardprotokolle (HTTP/gRPC), versionierte Schemata, Ports-and-Adapters.
- Austauschbare Bausteine (z. B. Inferenz-Server, Message-Bus) mit klaren SLAs.
- Eigene CI/CD, eigene Registries, Artefakt-Signing. Vermeiden Sie proprietäre, schwer exportierbare Datenformate.
3) Können wir Teile in der Cloud betreiben und trotzdem souverän bleiben?
- Ja, wenn Sie die Grenzen sauber ziehen:
- Keine personenbezogenen oder vertraulichen Produktionsdaten nach außen.
- Trainings-/Experimentierumgebungen können entkoppelt sein, Artefakte jedoch nur signiert und geprüft in die Produktion.
- Produktionsinferenz, OT-Integrationen und Observability bleiben on-prem. Internet darf ausfallen, ohne dass der Betrieb stoppt.
4) Wie dimensionieren wir Hardware für on-prem AI/LLM?
- Bottom-up über Latenz- und Durchsatzbudgets:
- Profilen Sie den Vertical Slice mit Zielmodellen (inkl. Quantisierung).
- Planen Sie GPU-Kapazität plus CPU-Fallbacks; trennen Sie Trainings- und Inferenzhardware.
- Berücksichtigen Sie Speicher für Artefakte, Feature Stores, Telemetrie (Aufbewahrungsfristen!), sowie Netzwerksegmente und Bandbreiten für Edge-Verteilungen.
5) Wie gehen wir mit Updates in Air-Gap-Umgebungen um?
- Mit einem kontrollierten Lieferprozess:
- Periodische Bundles (Container, Modelle, Policies) offline signieren und prüfen.
- A/B-Updates oder transaktionale Mechanismen mit automatischem Rollback.
- Dokumentierte Freigabeprozesse, Protokollierung jeder Änderung, regelmäßige Trockenübungen für Disaster Recovery.
Wenn Sie diese Prinzipien in Ihrer Organisation verankern, wird „Build“ nicht zur Dauerbaustelle, sondern zur planbaren, souveränen Plattform für industrielle Intelligenz.