Es gibt einen Moment in fast jedem KI-Projekt, den alle kennen, aber kaum jemand offen benennt: Der Prototyp funktioniert, die Demo begeistert, das Budget ist freigegeben – und trotzdem geht das Vorhaben sechs Monate später still und leise unter. Nicht weil das Modell schlecht war. Nicht weil das Team fehlte. Sondern weil niemand rechtzeitig die unbequeme Frage gestellt hat: Auf welchem Datenfundament bauen wir eigentlich?
Die unbequeme Wahrheit lautet: Die meisten KI-Projekte scheitern nicht an Algorithmen, nicht an fehlendem Fachpersonal und nicht an mangelndem Willen zur Digitalisierung. Sie scheitern an einer Datenarchitektur, die für die Anforderungen moderner KI-Systeme schlicht nicht gemacht wurde.
Das Tückische an einer schlechten Datenarchitektur ist ihre Latenz. Die Konsequenzen zeigen sich selten sofort. In frühen Projektphasen – wenn man mit sauberen Beispieldatensätzen, handverlesenen CSVs oder isolierten Datenbankauszügen arbeitet – läuft alles reibungslos. Das Modell lernt, die Metriken stimmen, das Team ist motiviert.
Das Problem entfaltet sich erst später: wenn reale, ungereinigte Produktionsdaten ins Spiel kommen, wenn mehrere Systeme integriert werden müssen, wenn das Modell in eine bestehende Infrastruktur eingebettet werden soll, die historisch gewachsen ist und entsprechend aussieht.
Dann offenbaren sich die eigentlichen Baustellen:
Technischer Schulden gegenüber KI-Projekten gibt es eine besondere Form: den Data Architecture Debt. Er entsteht dann, wenn Unternehmen ihre KI-Ambitionen schneller skalieren als ihre Dateninfrastruktur. Dieser Debt akkumuliert sich leise – durch Einzellösungen, die nie harmonisiert wurden, durch Datensilos, die organisch gewachsen sind, durch fehlende Governance-Prozesse und durch die Abwesenheit von Datenverantwortlichen mit echtem Gestaltungsmandat.
Was in der Praxis auffällt: Viele Unternehmen investieren erheblich in Modellentwicklung und vernachlässigen dabei systematisch drei fundamentale Schichten:
Fehlen diese Schichten oder sind sie unausgereift, baut man de facto auf Sand.
Unternehmen, die KI nachhaltig in ihre Wertschöpfung integrieren, unterscheiden sich von gescheiterten Projekten nicht primär durch bessere Modelle oder mehr Budget. Sie unterscheiden sich durch eine fundamentale Vorentscheidung: Sie behandeln Daten als strategisches Asset und nicht als notwendiges Übel.
Konkret bedeutet das:
Ein besonders verbreitetes Muster ist der sogenannte Prototyp-Produktions-Gap. Teams bauen beeindruckende Proof-of-Concepts auf der Basis von Daten, die für diesen Zweck manuell aufbereitet wurden. Das Modell performt gut – in der kontrollierten Umgebung. Sobald es in die Produktionsumgebung soll, stößt man auf Realität: heterogene Quellsysteme, fehlende Felder, unerwartete Verteilungsverschiebungen in den Eingangsdaten.
Das ist kein Modell-Problem. Das ist ein Architektur-Problem. Und es lässt sich nur lösen, wenn man es als solches akzeptiert.
Die beste Zeit, eine Datenarchitektur zu überdenken, war gestern. Die zweitbeste ist jetzt – am besten vor dem ersten Modell-Commit. Folgende Fragen sollten in jedem Projekt frühzeitig beantwortet sein:
KI ist kein Technologieproblem. KI ist ein Datenproblem, das mit Technologie gelöst werden muss. Wer diesen Zusammenhang versteht und Datenarchitektur nicht als lästige Infrastrukturaufgabe, sondern als strategische Kernkompetenz behandelt, hat einen entscheidenden Vorsprung gegenüber allen, die glauben, das nächste Modell-Update werde ihre fundamentalen Datenprobleme lösen.
Es wird das nicht tun. Aber eine solide Datenarchitektur schon.