Unternehmen reden viel über die möglichen Auswirkungen von KI- und ML-Lösungen, aber zu wenig über deren Qualität. Und die hängt in erster Linie vom Dateninput ab. APARAVI erklärt, warum die Diskussion vom Kopf auf die Füße gestellt werden muss, und wieso ein hochwertiges Dateninventar die Voraussetzung für eine sinn- und wertvolle KI- oder ML-Lösung ist.
Der Hype rund um generative AI konzentriert sich in erster Linie auf ethisch-moralische und sicherheitstechnische Aspekte. Doch das greift viel zu kurz. Beide drehen sich um Probleme der richtigen Anwendung von KI- und ML-Apps, unterschlagen dabei aber die alles entscheidende Frage ihrer Qualität. Und die wiederum hängt in erster Linie von der Qualität der Daten ab, mit denen die Algorithmen gefüttert und trainiert werden.
Doch genau daran hapert es viel zu oft, weil üblicherweise bis zu 80 Prozent der dafür in Frage kommenden Daten unstrukturiert sind. Dort verstecken sich nicht nur veraltete Dokumente oder risikobehaftete Daten, sondern eben auch wichtige, hochwertige Informationen. Daher ist es sinnvoll und notwendig, diese Datenbestände vorab zu klassifizieren, zu bereinigen und zu strukturieren.
APARAVI, Anbieter von Lösungen zur Verwaltung unstrukturierter Daten, erklärt, warum eine saubere Data Collection (Clean & Lean Data) für die Entwicklung von KI-Apps essenziell ist:
Schlechter Input, schlechter Output
Die Qualität des Outputs hängt, wie so oft, auch bei der KI-Entwicklung von der Qualität des Inputs ab. Je gepflegter also die Trainingsdaten, desto höher der Anwendungsnutzen. Ideal sind transparente, klassifizierte, strukturierte und priorisierte Daten (und auch Metadaten!), frei von Dubletten.
Ausgefilterte Risiken, weniger Fallstricke
In jedem Datenbestand lauern kritische Daten und Dokumente, die aus diversen rechtlichen Gründen nicht verwendet werden dürfen. Das können beispielsweise personenbezogene Daten oder Inhalte sein, die vor dem Stichtag einer Änderung rechtlich relevanter Vorgaben datieren. Diese müssen vorab unbedingt herausgefiltert werden, um Verfälschungen, Risiken und Strafzahlungen von vorneherein zu vermeiden.
Synthetische Daten versus echte Daten
Wie groß die Unzufriedenheit der Data Scientists mit dem Datenmaterial oft ist, zeigt sich an der wachsenden Nutzung synthetischer Daten. Dumm ist nur: Mit Originaldaten können Algorithmen und Anwendungen in der Praxis schneller und effizienter entwickelt werden.
Lange Entwicklungszeiten und hohe Kosten
KI-Entwicklung ist ein iterativer Prozess mit hohem Ressourcenbedarf – und damit ein teures Geschäft. Je schlechter der Dateninput ist, desto länger und kostenintensiver ist die Entwicklungszeit. Ein sauberer Datenbestand dagegen ist auf die relevanten, sinnvollen Daten kondensiert. Das beschleunigt die Anwendungsentwicklung, reduziert so die Kosten und ermöglicht zudem eine kürzere Time-to-Market. Und die kann für Erfolg oder Misserfolg entscheidend sein.
„Clean and Lean Data spielen bei der Entwicklung von KI- und ML-Apps eine überragende Rolle“, erklärt Adrian Knapp, CEO bei APARAVI. „Du bist, was Du isst: Der erste Schritt muss es daher sein, die wirklich relevanten Daten herauszufiltern und zu strukturieren, die Datenqualität zu steigern und so das perfekte Futter für das Training der Algorithmen zu liefern. An dieser Stelle entscheidet sich, ob eine KI-Anwendung erfolgreich wird.“
Themen:
LESEN SIE AUCH
Never Change a Winning Team? Absoluter Unsinn?
Für Unternehmen wird es zunehmend unabdingbar, Prozesse zu schaffen, die sich allein mit der gesamtunternehmerischen „Changeability“ befassen. Denn diese wird eine entscheidende Zukunftsdeterminante sein für Markterfolg oder -ausstieg, Gewinn oder Pleite, Jobmaschine oder Arbeitsplatzabbau.
Datenverluste entstehen meist aus Fahrlässigkeit
Datenverluste sind kein bösartiges Schicksal und das Muster erfolgreicher Data Breaches ist bekannt: unzureichend gesicherte Netzwerke dienen als Einfallstor zur leichten Beute der unstrukturierten Datenbestände. Wer diese Missstände nicht behebt, darf sich nicht wundern, das nächste Opfer zu sein.
Anti-Trend 2023: Dark Data sollte nicht fortgeschrieben werden
Die Kombination aus gedankenloser Verschwendung von Daten und mangelndem Risiko- und Problembewusstsein der Unternehmen ist ein gefährliches Spiel auf Zeit. Warum es einen ökonomisch sinnvollen und ökologisch verantwortungsbewussten Umgang mit Daten braucht.
Einsatz von KI erfordert Update für das Arbeitsrecht
Der zunehmende Einsatz künstlicher Intelligenz stellt das Arbeitsrecht vor vielfältige Herausforderungen, unter anderem beim Daten- und Diskriminierungsschutz oder in Haftungsfragen. Wo liegen die Aufgaben für die Gesetzgebung und was Bedarf es für ihre Lösung?
Unsere Themen im Überblick
Themenwelt
Wirtschaft
Management
Recht
Finanzen
Assekuranz
Digitalmacht ohne Substanz – Warum Europa beim KI-Wettlauf ins Hintertreffen gerät
Europa ruft nach Souveränität, investiert Milliarden, reguliert ambitioniert – und bleibt doch in der digitalen Peripherie. Trotz der politischen Verve, Künstliche Intelligenz zur strategischen Schlüsseltechnologie Europas zu erklären, ist das Bild ernüchternd: Die Substanz fehlt.
Mit KI zum digitalen Abschluss: die Bayerische und muffintech starten Pilotprojekt zur Antragsunterstützung
Die Versicherungsgruppe die Bayerische und das Technologie-Start-up muffintech starten ein gemeinsames Pilotprojekt zur digitalen Vertriebsunterstützung in der Sachversicherung. Im Zentrum steht der KI-Assistent LEA, der Kunden durch den Online-Antragsprozess begleitet und in Echtzeit Fragen beantwortet. Der erste Einsatz erfolgt im Bereich der Zahnzusatzversicherung, weitere Sparten wie die Hausratversicherung sollen kurzfristig folgen.
Wie KI-Agenten den Beratungsalltag neu definieren
Die Maklerarbeit verändert sich rasant: Digitale Assistenten auf KI-Basis übernehmen Routinetätigkeiten und ermöglichen so mehr Fokus auf Beratung und Beziehungspflege. Jonathan Posselt, Teamleiter KI bei Fonds Finanz, zeigt im Gastbeitrag, wie Maklerbüros schon heute die Weichen für die Zukunft stellen können. Der Text erschien zuerst im expertenReport 07/25.
Versicherungs-KI mit Potenzial – aber auch mit Vorbehalten
Viele Deutsche würden gerne Künstliche Intelligenz nutzen, um Versicherungsanträge schneller und einfacher zu erledigen. Auch bei der Vertragsanalyse zeigen sich viele aufgeschlossen. Doch sobald es um Gesundheitsdaten oder Schadensbewertungen geht, kippt die Stimmung.
Die neue Ausgabe kostenlos im Kiosk
Werfen Sie einen Blick in die aktuelle Ausgabe und überzeugen Sie sich selbst vom ExpertenReport. Spannende Titelstories, fundierte Analysen und hochwertige Gestaltung – unser Magazin gibt es auch digital im Kiosk.