Sind Ihre Daten gut genug für Ihre Pläne für maschinelles Lernen/KI?

KI-Entwicklungen haben für Unternehmen und Regierungen auf der ganzen Welt Priorität. Dennoch bleibt ein grundlegender Aspekt der KI übersehen: schlechte Datenqualität.

KI-Algorithmen verlassen sich auf zuverlässige Daten, um optimale Ergebnisse zu erzielen. Wenn die Daten voreingenommen, unvollständig, unzureichend und ungenau sind, hat dies verheerende Folgen.

KI-Systeme, die Krankheiten von Patienten erkennen, sind ein hervorragendes Beispiel dafür, wie schlechte Datenqualität zu unerwünschten Ergebnissen führen kann. Wenn diese Systeme mit unzureichenden Daten aufgenommen werden, erzeugen sie falsche Diagnosen und ungenaue Vorhersagen, was zu Fehldiagnosen und verzögerten Behandlungen führt. Eine an der University of Cambridge durchgeführte Studie mit über 400 Tools zur Diagnose von Covid-19 ergab beispielsweise, dass KI-generierte Berichte aufgrund fehlerhafter Datensätze völlig unbrauchbar waren.

>

Mit anderen Worten, Ihre KI-Initiativen werden verheerende Auswirkungen auf die reale Welt haben, wenn Ihre Daten nicht gut genug sind.

Was bedeutet „gut genug“ Daten?

Es gibt eine ziemliche Debatte darüber, was "gut genug" Daten bedeutet. Einige sagen, dass die Daten nicht gut genug sind. Andere sagen, dass der Bedarf an guten Daten zu einer Lähmung der Analyse führt, während HBR fest davon überzeugt ist, dass Ihre Tools für maschinelles Lernen nutzlos sind, wenn Ihre Informationen schlecht sind.

Bei WinPure definieren wir ausreichend gute Daten als vollständige, genaue und gültige Daten, die mit Zuversicht für Geschäftsprozesse mit akzeptablen Risiken verwendet werden können, einschließlich der Ebene, die dem Einzelnen unterliegt Ziele und Umstände eines Unternehmens.“

Die meisten Unternehmen kämpfen mehr als sie zugeben mit Datenqualität und Governance. Spannung hinzufügen; Sie sind überfordert und stehen unter immensem Druck, KI-Initiativen einzusetzen, um wettbewerbsfähig zu bleiben. Leider bedeutet dies, dass Probleme wie schmutzige Daten erst dann Gegenstand von Vorstandsdiskussionen sind, wenn sie zum Scheitern eines Projekts führen.

Wie wirkt sich schlechte Datenqualität auf KI-Systeme aus?

Datenqualitätsprobleme treten früh im Prozess auf, wenn der Algorithmus die Trainingsdaten nutzt, um Muster zu lernen. Wenn beispielsweise ein KI-Algorithmus mit ungefilterten Social-Media-Daten kommt, nimmt er Beleidigungen, rassistische Kommentare und frauenfeindliche Bemerkungen auf, wie es bei Microsofts KI-Bot zu sehen ist. Kürzlich wurde die Unfähigkeit der KI, dunkelhäutige Menschen zu erkennen, auch auf unvollständige Daten zurückgeführt.

In welcher Beziehung steht dies zur Datenqualität?

Fehlende Datenverwaltung, mangelndes Bewusstsein für die Datenqualität und isolierte Ansichten von Daten (bei denen möglicherweise eine solche geschlechtsspezifische Ungleichheit festgestellt wurde) führen zu schlechten Ergebnissen.

Was zu tun ist?

Wenn Unternehmen feststellen, dass sie ein Problem mit der Datenqualität haben, geraten sie in Panik, Mitarbeiter einzustellen. Berater, Ingenieure und Analysten werden blind eingestellt, um Diagnosen zu stellen, Daten zu bereinigen und Probleme so schnell wie möglich zu lösen. Leider vergehen Monate, bevor Fortschritte erzielt werden, und trotz Millionenausgaben für Arbeitskräfte scheinen die Probleme nicht zu verschwinden. Eine spontane Herangehensweise an ein Datenqualitätsproblem ist wenig hilfreich.

Echte Veränderungen beginnen an der Basis.

Hier sind drei wichtige Schritte, die Sie unternehmen müssen, wenn Sie möchten, dass sich Ihr KI/ML-Projekt in die richtige Richtung bewegt.

Sensibilisieren und Datenqualitätsprobleme erkennen

Bewerten Sie zunächst die Qualität Ihrer Daten, indem Sie eine Kultur der Datenkompetenz aufbauen. Bill Schmarzo, eine starke Stimme in der Branche, empfiehlt den Einsatz von Design Thinking, um eine Kultur zu schaffen, in der jeder die Datenziele und -herausforderungen eines Unternehmens versteht und dazu beitragen kann.

In der heutigen Geschäftslandschaft liegen Daten und Datenqualität nicht mehr allein in der Verantwortung der IT- oder Datenteams. Geschäftsanwender sollten sich unter anderem der Probleme mit schmutzigen Daten und inkonsistenten und doppelten Daten bewusst sein.

Also die erste wichtige Sache, die Sie tun sollten: Datenqualitätstraining zu einer organisatorischen Anstrengung machen und Teams befähigen, schlechte Datenattribute zu erkennen.

Hier ist eine Checkliste, die Sie verwenden können, um ein Gespräch über Ihre Datenqualität zu beginnen.

Sind Ihre Daten gut genug für Ihre Pläne für maschinelles Lernen/KI?

KI-Entwicklungen haben für Unternehmen und Regierungen auf der ganzen Welt Priorität. Dennoch bleibt ein grundlegender Aspekt der KI übersehen: schlechte Datenqualität.

KI-Algorithmen verlassen sich auf zuverlässige Daten, um optimale Ergebnisse zu erzielen. Wenn die Daten voreingenommen, unvollständig, unzureichend und ungenau sind, hat dies verheerende Folgen.

KI-Systeme, die Krankheiten von Patienten erkennen, sind ein hervorragendes Beispiel dafür, wie schlechte Datenqualität zu unerwünschten Ergebnissen führen kann. Wenn diese Systeme mit unzureichenden Daten aufgenommen werden, erzeugen sie falsche Diagnosen und ungenaue Vorhersagen, was zu Fehldiagnosen und verzögerten Behandlungen führt. Eine an der University of Cambridge durchgeführte Studie mit über 400 Tools zur Diagnose von Covid-19 ergab beispielsweise, dass KI-generierte Berichte aufgrund fehlerhafter Datensätze völlig unbrauchbar waren.

>

Mit anderen Worten, Ihre KI-Initiativen werden verheerende Auswirkungen auf die reale Welt haben, wenn Ihre Daten nicht gut genug sind.

Was bedeutet „gut genug“ Daten?

Es gibt eine ziemliche Debatte darüber, was "gut genug" Daten bedeutet. Einige sagen, dass die Daten nicht gut genug sind. Andere sagen, dass der Bedarf an guten Daten zu einer Lähmung der Analyse führt, während HBR fest davon überzeugt ist, dass Ihre Tools für maschinelles Lernen nutzlos sind, wenn Ihre Informationen schlecht sind.

Bei WinPure definieren wir ausreichend gute Daten als vollständige, genaue und gültige Daten, die mit Zuversicht für Geschäftsprozesse mit akzeptablen Risiken verwendet werden können, einschließlich der Ebene, die dem Einzelnen unterliegt Ziele und Umstände eines Unternehmens.“

Die meisten Unternehmen kämpfen mehr als sie zugeben mit Datenqualität und Governance. Spannung hinzufügen; Sie sind überfordert und stehen unter immensem Druck, KI-Initiativen einzusetzen, um wettbewerbsfähig zu bleiben. Leider bedeutet dies, dass Probleme wie schmutzige Daten erst dann Gegenstand von Vorstandsdiskussionen sind, wenn sie zum Scheitern eines Projekts führen.

Wie wirkt sich schlechte Datenqualität auf KI-Systeme aus?

Datenqualitätsprobleme treten früh im Prozess auf, wenn der Algorithmus die Trainingsdaten nutzt, um Muster zu lernen. Wenn beispielsweise ein KI-Algorithmus mit ungefilterten Social-Media-Daten kommt, nimmt er Beleidigungen, rassistische Kommentare und frauenfeindliche Bemerkungen auf, wie es bei Microsofts KI-Bot zu sehen ist. Kürzlich wurde die Unfähigkeit der KI, dunkelhäutige Menschen zu erkennen, auch auf unvollständige Daten zurückgeführt.

In welcher Beziehung steht dies zur Datenqualität?

Fehlende Datenverwaltung, mangelndes Bewusstsein für die Datenqualität und isolierte Ansichten von Daten (bei denen möglicherweise eine solche geschlechtsspezifische Ungleichheit festgestellt wurde) führen zu schlechten Ergebnissen.

Was zu tun ist?

Wenn Unternehmen feststellen, dass sie ein Problem mit der Datenqualität haben, geraten sie in Panik, Mitarbeiter einzustellen. Berater, Ingenieure und Analysten werden blind eingestellt, um Diagnosen zu stellen, Daten zu bereinigen und Probleme so schnell wie möglich zu lösen. Leider vergehen Monate, bevor Fortschritte erzielt werden, und trotz Millionenausgaben für Arbeitskräfte scheinen die Probleme nicht zu verschwinden. Eine spontane Herangehensweise an ein Datenqualitätsproblem ist wenig hilfreich.

Echte Veränderungen beginnen an der Basis.

Hier sind drei wichtige Schritte, die Sie unternehmen müssen, wenn Sie möchten, dass sich Ihr KI/ML-Projekt in die richtige Richtung bewegt.

Sensibilisieren und Datenqualitätsprobleme erkennen

Bewerten Sie zunächst die Qualität Ihrer Daten, indem Sie eine Kultur der Datenkompetenz aufbauen. Bill Schmarzo, eine starke Stimme in der Branche, empfiehlt den Einsatz von Design Thinking, um eine Kultur zu schaffen, in der jeder die Datenziele und -herausforderungen eines Unternehmens versteht und dazu beitragen kann.

In der heutigen Geschäftslandschaft liegen Daten und Datenqualität nicht mehr allein in der Verantwortung der IT- oder Datenteams. Geschäftsanwender sollten sich unter anderem der Probleme mit schmutzigen Daten und inkonsistenten und doppelten Daten bewusst sein.

Also die erste wichtige Sache, die Sie tun sollten: Datenqualitätstraining zu einer organisatorischen Anstrengung machen und Teams befähigen, schlechte Datenattribute zu erkennen.

Hier ist eine Checkliste, die Sie verwenden können, um ein Gespräch über Ihre Datenqualität zu beginnen.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow