Saubere Datensätze als Erfolgsfaktor für KI-Anwendungen

Veröffentlichung: 31.07.2023, 15:07 Uhr - Lesezeit 5 Minuten

Unternehmen reden viel über die möglichen Auswirkungen von KI- und ML-Lösungen, aber zu wenig über deren Qualität. Und die hängt in erster Linie vom Dateninput ab. APARAVI erklärt, warum die Diskussion vom Kopf auf die Füße gestellt werden muss, und wieso ein hochwertiges Dateninventar die Voraussetzung für eine sinn- und wertvolle KI- oder ML-Lösung ist.

(PDF)

Businesswoman works in office with a laptop with internet effects. Concept of internet sharing and company startupalphaspirit – stock.adobe.com

Der Hype rund um generative AI konzentriert sich in erster Linie auf ethisch-moralische und sicherheitstechnische Aspekte. Doch das greift viel zu kurz. Beide drehen sich um Probleme der richtigen Anwendung von KI- und ML-Apps, unterschlagen dabei aber die alles entscheidende Frage ihrer Qualität. Und die wiederum hängt in erster Linie von der Qualität der Daten ab, mit denen die Algorithmen gefüttert und trainiert werden.

Doch genau daran hapert es viel zu oft, weil üblicherweise bis zu 80 Prozent der dafür in Frage kommenden Daten unstrukturiert sind. Dort verstecken sich nicht nur veraltete Dokumente oder risikobehaftete Daten, sondern eben auch wichtige, hochwertige Informationen. Daher ist es sinnvoll und notwendig, diese Datenbestände vorab zu klassifizieren, zu bereinigen und zu strukturieren.

APARAVI, Anbieter von Lösungen zur Verwaltung unstrukturierter Daten, erklärt, warum eine saubere Data Collection (Clean & Lean Data) für die Entwicklung von KI-Apps essenziell ist:

Schlechter Input, schlechter Output

Die Qualität des Outputs hängt, wie so oft, auch bei der KI-Entwicklung von der Qualität des Inputs ab. Je gepflegter also die Trainingsdaten, desto höher der Anwendungsnutzen. Ideal sind transparente, klassifizierte, strukturierte und priorisierte Daten (und auch Metadaten!), frei von Dubletten.

Ausgefilterte Risiken, weniger Fallstricke

In jedem Datenbestand lauern kritische Daten und Dokumente, die aus diversen rechtlichen Gründen nicht verwendet werden dürfen. Das können beispielsweise personenbezogene Daten oder Inhalte sein, die vor dem Stichtag einer Änderung rechtlich relevanter Vorgaben datieren. Diese müssen vorab unbedingt herausgefiltert werden, um Verfälschungen, Risiken und Strafzahlungen von vorneherein zu vermeiden.

Synthetische Daten versus echte Daten

Wie groß die Unzufriedenheit der Data Scientists mit dem Datenmaterial oft ist, zeigt sich an der wachsenden Nutzung synthetischer Daten. Dumm ist nur: Mit Originaldaten können Algorithmen und Anwendungen in der Praxis schneller und effizienter entwickelt werden.

Lange Entwicklungszeiten und hohe Kosten

KI-Entwicklung ist ein iterativer Prozess mit hohem Ressourcenbedarf – und damit ein teures Geschäft. Je schlechter der Dateninput ist, desto länger und kostenintensiver ist die Entwicklungszeit. Ein sauberer Datenbestand dagegen ist auf die relevanten, sinnvollen Daten kondensiert. Das beschleunigt die Anwendungsentwicklung, reduziert so die Kosten und ermöglicht zudem eine kürzere Time-to-Market. Und die kann für Erfolg oder Misserfolg entscheidend sein.

„Clean and Lean Data spielen bei der Entwicklung von KI- und ML-Apps eine überragende Rolle“, erklärt Adrian Knapp, CEO bei APARAVI. „Du bist, was Du isst: Der erste Schritt muss es daher sein, die wirklich relevanten Daten herauszufiltern und zu strukturieren, die Datenqualität zu steigern und so das perfekte Futter für das Training der Algorithmen zu liefern. An dieser Stelle entscheidet sich, ob eine KI-Anwendung erfolgreich wird.“

Dieses Listicle kann auch hier abgerufen werden.

Themen:

[..]

Dateninventar

Anwendungsentwicklung

Dateninput

(PDF)

LESEN SIE AUCH

Caucasian stressful business woman with laptop frelancer girl frustrated shocked reading bad online news email failed test exam results reads unexpected terrible information upset problem notificationYuliia – stock.adobe.com

09.06.2023

Digitalisierung

Unsere Themen im Überblick

Informieren Sie sich über aktuelle Entwicklungen und Hintergründe aus zentralen Bereichen der Branche.

Themenwelt

Praxisnahe Beiträge zu zentralen Themen rund um Vorsorge, Sicherheit und Alltag.

Wirtschaft

Analysen, Meldungen und Hintergründe zu nationalen und internationalen Wirtschaftsthemen.

Management

Strategien, Tools und Trends für erfolgreiche Unternehmensführung.

Recht

Wichtige Urteile, Gesetzesänderungen und rechtliche Hintergründe im Überblick.

Finanzen

Neuigkeiten zu Märkten, Unternehmen und Produkten aus der Finanzwelt.

Assekuranz

Aktuelle Entwicklungen, Produkte und Unternehmensnews aus der Versicherungsbranche.

Mehr zum Thema

Der Vermittler von 2030 ist kein Datenverwalter mehr, sondern ein fast reiner Beziehungsmanager und strategischer Berater, meintblau direkt GmbH

24.06.2026

Digitalisierung

„Der Vermittler von 2030 ist kein Datenverwalter mehr“

Viele Makler nutzen heute bereits KI-gestützte Assistenten. Für Hans-Peter Wolf, Chief Product & Technology Officer von blau direkt, ist das jedoch erst der Anfang. Im Interview erklärt er, warum klassische Plattformen und KI-Copiloten nur Zwischenschritte sind, welche Aufgaben autonome KI-Agenten künftig übernehmen sollen und weshalb der Vermittler trotzdem die zentrale Figur im Beratungsprozess bleibt.

Künstliche Intelligenz unterstützt Versicherer zunehmend bei der Aufnahme, Analyse und Vorprüfung von Schadenfällen. Ziel ist eine schnellere Bearbeitung von Standardprozessen, während die Entscheidungshoheit weiterhin bei den Mitarbeitern bleibt.Redaktion experten.de / KI-generiert

19.06.2026

Digitalisierung

KI im Schadenmanagement: Wenn der Schaden zuerst mit einer KI spricht

Künstliche Intelligenz entwickelt sich zunehmend vom Experimentierfeld zur Alltagstechnologie der Versicherungswirtschaft. Besonders im Schadenmanagement setzen viele Unternehmen auf automatisierte Prozesse, intelligente Dokumentenanalyse und digitale Betrugserkennung. Nach Einschätzung von Assekurata liegen die Potenziale vor allem in schnelleren Abläufen und einer effizienteren Schadenregulierung.

Künstliche Intelligenz unterstützt Unternehmen zunehmend bei der Erstellung, Prüfung und Verwaltung von Verträgen. Laut einer Studie von Deloitte und Docusign lassen sich dadurch Vertragsprozesse beschleunigen und erhebliche Zeitgewinne erzielen.Redaktion experten.de / KI-generiert

10.06.2026

Digitalisierung

22 Stunden weniger pro Vertrag: Warum KI jetzt das Vertragswesen verändert

Viele Unternehmen verbinden Künstliche Intelligenz vor allem mit Chatbots, Kundenservice oder Automatisierung im Vertrieb. Eine neue Studie von Deloitte und Docusign zeigt jedoch: Besonders große Effizienzpotenziale liegen in einem Bereich, der bislang oft wenig Aufmerksamkeit erhält – dem Vertragsmanagement. Deutsche Unternehmen sparen laut der Untersuchung bereits heute durchschnittlich 22 Stunden pro Vertragsprozess.

Viele ältere Versicherte nutzen digitale Geräte, bevorzugen bei Versicherungsunterlagen und Vertragsinformationen jedoch weiterhin klassische Papierdokumente.Redaktion experten.de / KI-generiert

08.06.2026

Digitalisierung

Digitale Versicherung? Die Generation Ü65 hält am Papier fest

Digitale Schadenmeldungen, Apps und automatisierte Prozesse gewinnen in der Versicherungsbranche an Bedeutung. Doch eine aktuelle Bitkom-Studie zeigt: Die Erwartungen der Kunden unterscheiden sich stark nach Alter. Während Jüngere zunehmend digitale Services bevorzugen, bleiben Papierunterlagen und persönliche Beratung insbesondere für ältere Versicherte wichtig.

Mehr als die Hälfte der deutschen Unternehmen setzt inzwischen KI ein. Die eigentliche Frage lautet jedoch nicht mehr, wer KI nutzt, sondern wer die Technologie beherrscht.Experten/Ki

08.06.2026

Digitalisierung

KI wird zum Infrastrukturstandard der deutschen Wirtschaft

Mehr als die Hälfte der Unternehmen nutzt KI. Entscheidend ist nicht die Verbreitung, sondern die wachsende Abhängigkeit von externen Plattformen und die Veränderung von Wettbewerbsstrukturen.

Die neue Ausgabe kostenlos im Kiosk

Werfen Sie einen Blick in die aktuelle Ausgabe und überzeugen Sie sich selbst vom ExpertenReport. Spannende Titelstories, fundierte Analysen und hochwertige Gestaltung – unser Magazin gibt es auch digital im Kiosk.

Ausgabe 05/26

"Nicht laut, aber immer noch relevant"

Wibke Becker - Generalbevollmächtigte & Leiterin Maklervertrieb - Continentale - Mannheimer - EUROPA

JETZT LESEN

Ausgabe 03/26

"Ein kurzfristiges Strohfeuer machen wir nicht mit."

Frank Kettnaker und Christian Pape - Vorstand ALH Gruppe

JETZT LESEN

Ausgabe 10/25

"Viele Eltern unterschätzen die finanziellen Folgen, wenn ihr Kind berufsunfähig wird."

Jens Göhner, Leiter Produktmanagement der Stuttgarter

JETZT LESEN

Ausgabe 07/25

"Unabhängigkeit hat viele Gesichter"

Was bedeutet Unabhängigkeit im Versicherungsvertrieb wirklich?

JETZT LESEN

Ausgabe 05/25

"Das Gesamtpaket muss stimmen"

Bernd Einmold & Sascha Bassir

JETZT LESEN

Kostenlos

Alle Ausgaben entdecken

Blättern Sie durch unser digitales Archiv im Kiosk und lesen Sie alle bisherigen Ausgaben des ExpertenReports. Zur Kiosk-Übersicht

Saubere Datensätze als Erfolgsfaktor für KI-Anwendungen

Schlechter Input, schlechter Output

Ausgefilterte Risiken, weniger Fallstricke

Synthetische Daten versus echte Daten

Lange Entwicklungszeiten und hohe Kosten

Themen:

LESEN SIE AUCH

Die vier beliebtesten Ausreden, den Datenschutz zu verschlafen

Never Change a Winning Team? Absoluter Unsinn?

Datenverluste entstehen meist aus Fahrlässigkeit

Anti-Trend 2023: Dark Data sollte nicht fortgeschrieben werden

Einsatz von KI erfordert Update für das Arbeitsrecht

Unsere Themen im Überblick

Themenwelt

Wirtschaft

Management

Recht

Finanzen

Assekuranz

Mehr zum Thema

„Der Vermittler von 2030 ist kein Datenverwalter mehr“

KI im Schadenmanagement: Wenn der Schaden zuerst mit einer KI spricht

22 Stunden weniger pro Vertrag: Warum KI jetzt das Vertragswesen verändert

Digitale Versicherung? Die Generation Ü65 hält am Papier fest

KI wird zum Infrastrukturstandard der deutschen Wirtschaft

Die neue Ausgabe kostenlos im Kiosk

"Nicht laut, aber immer noch relevant"

"Ein kurzfristiges Strohfeuer machen wir nicht mit."

"Viele Eltern unterschätzen die finanziellen Folgen, wenn ihr Kind berufsunfähig wird."

"Unabhängigkeit hat viele Gesichter"

"Das Gesamtpaket muss stimmen"

Alle Ausgaben entdecken

Kontakt

Rubriken

Experten

Aktuelle Mediadaten

Redaktion

Rechtliches

KIOSK

Abo