Künstliche Intelligenz | Themen & Trends
Wozu braucht es synthetische Daten?
Synthetische Daten sind künstlich erzeugte Daten, die typische Merkmale realer Daten nachbilden, ohne echte Fälle eins zu eins zu übernehmen. Ihr Wert liegt vor allem dort, wo mit Originaldaten nicht frei gearbeitet werden kann oder darf.
Für Verwaltung und Justiz ist das besonders relevant: Wer erste digitale Lösungen erproben, Verfahren testen oder interne Dokumente automatisiert verarbeiten möchte, braucht eine datenschutzgerechte Grundlage. Synthetische Daten können helfen, Prototypen zu entwickeln, Prozesse zu prüfen und den Einstieg in KI-Anwendungen zu ermöglichen – ohne sofort mit hochsensiblen Echtdaten zu arbeiten.

Synthetische Daten: nicht automatisch sicher
Welche Probleme gibt es bei der Erstellung von synthetischen Daten?
Der Begriff klingt zunächst beruhigend: künstlich erzeugt, also sicher. In der Praxis ist die Erstellung jedoch anspruchsvoll. Wenn synthetische Daten zu nah an realen Daten bleiben, kann das Risiko bestehen, dass einzelne Informationen indirekt wiedererkannt werden. Wenn sie sich dagegen zu weit von der Wirklichkeit entfernen, verlieren sie ihren praktischen Nutzen. Hinzu kommt ein weiteres Problem: Fehler, Verzerrungen oder unausgewogene Muster können beim Erzeugen der Daten übernommen oder sogar verstärkt werden. Dann entsteht zwar ein formal neuer Datensatz, aber keine verlässliche Grundlage für tragfähige digitale Entscheidungen.
Was hat das Thema mit Sicherheit zu tun?
Sicherheit bedeutet in diesem Zusammenhang mehr als nur Datenschutz. Es geht auch um Nachvollziehbarkeit, Verlässlichkeit und rechtssichere Nutzung. Synthetische Daten müssen so erzeugt werden, dass sie keine Rückschlüsse auf reale Personen zulassen und zugleich fachlich plausibel bleiben. Dafür braucht es klare Verfahren, Prüfungen und dokumentierte Qualitätskriterien. Auch unter der DSGVO ist entscheidend, ob tatsächlich keine Re-Identifikation mehr möglich ist. Fachliche Leitfäden zur Anonymisierung und aktuelle Einordnungen im Datenschutz zeigen deutlich: „synthetisch“ ist keine automatische Freigabe. Sicherheit entsteht erst durch einen kontrollierten Prozess, nicht durch das Schlagwort allein.
Warum ist das wichtig für Westernacher Solutions?
Westernacher Solutions treibt den digitalen Fortschritt voran: Mit sicheren IT-Lösungen für Justiz und Verwaltung gestalten wir effiziente Prozesse und schaffen die Grundlage für eine zukunftsfähige Demokratie. Gerade deshalb betrachten wir synthetische Daten nicht als Abkürzung, sondern als Teil einer verantwortungsvollen Digitalstrategie. Wer öffentliche IT modernisiert, muss nicht nur an Innovation denken, sondern immer auch an Schutzinteressen, Nachvollziehbarkeit und langfristige Tragfähigkeit. Genau diese Verbindung aus technischem Fortschritt und öffentlicher Verantwortung ist für uns entscheidend.
Wo wendet Westernacher Solutions synthetische Daten an?
Wir nutzen diese Möglichkeit, um Dokumente anonym und sicher zu erstellen, die wir anschließend verwenden können, um erste KI-Lösungen für Kundinnen und Kunden zu bauen und zu testen: datenschutzgerecht und im Einklang mit der DSGVO.
So nutzt Westernacher Solutions synthetische generierte PDF-Dokumente, um die KI-basierte Lösung „STAN“ zu entwickeln und erproben. STAN kann dadurch Informationen (Namen, Adressen, Verfahrensdaten, Aktenzeichen, etc.) aus fachspezifischen PDF-Dokument extrahieren, die eine Basis für eine digitale Verwaltung und Aktensysteme sind.
Fazit
Synthetische Daten können ein wichtiger Baustein für sichere und zukunftsfähige KI-Projekte in Verwaltung und Justiz sein. Sie lösen jedoch nicht automatisch die zentralen Fragen von Datenschutz, Qualität und Sicherheit. Entscheidend ist, wie sie erzeugt, geprüft und eingesetzt werden. Unsere Kundinnen und Kunden sollten deshalb nicht nur auf ausgeglichene, sondern vor allem auf sichere und belastbare Datengrundlagen achten. Genau dabei hilft die Expertise von Westernacher Solutions: Wir verbinden technisches Verständnis mit dem Anspruch, digitale Lösungen rechtskonform, nachvollziehbar und langfristig tragfähig zu gestalten. Synthetische Daten sind keine Abkürzung, sondern Teil einer durchdachten Digitalstrategie.


Ihre Ansprechpartnerin
Shiva Banasaz Nouri
AI Competence Center
AUCH INTERESSANT







