Ein Arzt betritt eine Bar: Mit verantwortungsvoller KI gegen Bildverzerrung vorgehen

Sie konnten nicht an der Transform 2022 teilnehmen? Sehen Sie sich jetzt alle Summit-Sessions in unserer On-Demand-Bibliothek an! Schau mal hier.

Ein Arzt kommt in eine Bar…

Was hat das Erstellen eines schlechten Witzes mit Bildverzerrung in DALL-E zu tun?

hoch

DALL-E ist ein von OpenAI entwickeltes Programm für künstliche Intelligenz, das Bilder aus Textbeschreibungen erstellt. Es verwendet eine 12-Milliarden-Parameter-Version des GPT-3-Transformer-Modells, um Eingaben in natürlicher Sprache zu interpretieren und entsprechende Bilder zu erzeugen. DALL-E kann realistische Bilder erzeugen und ist eines der besten multimodalen Modelle, die heute erhältlich sind.

Sein Innenleben und seine Quelle sind nicht öffentlich verfügbar, aber wir können es über eine API-Schicht aufrufen, indem wir eine Texteingabeaufforderung mit der Beschreibung des zu generierenden Bildes übergeben. Dies ist ein großartiges Beispiel für ein beliebtes Muster namens „As a Service Pattern“. Auf ein so unglaubliches Modell musste natürlich lange gewartet werden und als ich endlich Zugang bekam, wollte ich alle möglichen Kombinationen ausprobieren.

Vorfall

MetaBeat 2022

MetaBeat wird am 4. Oktober in San Francisco, CA, Vordenker zusammenbringen, um darüber zu beraten, wie die Metaverse-Technologie die Art und Weise verändern wird, wie alle Branchen kommunizieren und Geschäfte machen.

hier registrieren

Eine Sache, die ich herausfinden wollte, waren etwaige inhärente Verzerrungen des Modells. Also habe ich zwei separate Eingabeaufforderungen eingegeben und Sie können die Ergebnisse in der Abbildung oben sehen.

Vom Textprompt „Der Arzt kommt in eine Bar“ produzierte das Modell nur männliche Ärzte in einer Bar. Geschickt platziert er den Arzt im Anzug mit Stethoskop und Krankenblatt in einer Bar, die er dunkel in Szene setzt. Als ich jedoch die Eingabeaufforderung „Krankenschwester betritt eine Bar“ eingab, waren die Ergebnisse rein weiblich und eher karikaturistisch, wodurch die Bar eher als Kinderspielzimmer hervorgehoben wurde. Neben der männlichen und weiblichen Tendenz bei den Begriffen "Arzt" und "Krankenschwester" können Sie auch die Änderung der Darstellung des Balkens basierend auf dem Geschlecht der Person erkennen.

Wie verantwortungsbewusste KI dazu beitragen kann, Verzerrungen in maschinellen Lernmodellen zu bekämpfen

OpenAI hat diese Verzerrung sehr schnell bemerkt und Änderungen am Modell vorgenommen, um zu versuchen, sie abzumildern. Sie testeten das Modell an Bevölkerungsgruppen, die in ihren Trainingssets unterrepräsentiert waren – eine Krankenschwester, ein weiblicher CEO usw. Dies ist eine aktive Herangehensweise an h ...

Ein Arzt betritt eine Bar: Mit verantwortungsvoller KI gegen Bildverzerrung vorgehen

Sie konnten nicht an der Transform 2022 teilnehmen? Sehen Sie sich jetzt alle Summit-Sessions in unserer On-Demand-Bibliothek an! Schau mal hier.

Ein Arzt kommt in eine Bar…

Was hat das Erstellen eines schlechten Witzes mit Bildverzerrung in DALL-E zu tun?

hoch

DALL-E ist ein von OpenAI entwickeltes Programm für künstliche Intelligenz, das Bilder aus Textbeschreibungen erstellt. Es verwendet eine 12-Milliarden-Parameter-Version des GPT-3-Transformer-Modells, um Eingaben in natürlicher Sprache zu interpretieren und entsprechende Bilder zu erzeugen. DALL-E kann realistische Bilder erzeugen und ist eines der besten multimodalen Modelle, die heute erhältlich sind.

Sein Innenleben und seine Quelle sind nicht öffentlich verfügbar, aber wir können es über eine API-Schicht aufrufen, indem wir eine Texteingabeaufforderung mit der Beschreibung des zu generierenden Bildes übergeben. Dies ist ein großartiges Beispiel für ein beliebtes Muster namens „As a Service Pattern“. Auf ein so unglaubliches Modell musste natürlich lange gewartet werden und als ich endlich Zugang bekam, wollte ich alle möglichen Kombinationen ausprobieren.

Vorfall

MetaBeat 2022

MetaBeat wird am 4. Oktober in San Francisco, CA, Vordenker zusammenbringen, um darüber zu beraten, wie die Metaverse-Technologie die Art und Weise verändern wird, wie alle Branchen kommunizieren und Geschäfte machen.

hier registrieren

Eine Sache, die ich herausfinden wollte, waren etwaige inhärente Verzerrungen des Modells. Also habe ich zwei separate Eingabeaufforderungen eingegeben und Sie können die Ergebnisse in der Abbildung oben sehen.

Vom Textprompt „Der Arzt kommt in eine Bar“ produzierte das Modell nur männliche Ärzte in einer Bar. Geschickt platziert er den Arzt im Anzug mit Stethoskop und Krankenblatt in einer Bar, die er dunkel in Szene setzt. Als ich jedoch die Eingabeaufforderung „Krankenschwester betritt eine Bar“ eingab, waren die Ergebnisse rein weiblich und eher karikaturistisch, wodurch die Bar eher als Kinderspielzimmer hervorgehoben wurde. Neben der männlichen und weiblichen Tendenz bei den Begriffen "Arzt" und "Krankenschwester" können Sie auch die Änderung der Darstellung des Balkens basierend auf dem Geschlecht der Person erkennen.

Wie verantwortungsbewusste KI dazu beitragen kann, Verzerrungen in maschinellen Lernmodellen zu bekämpfen

OpenAI hat diese Verzerrung sehr schnell bemerkt und Änderungen am Modell vorgenommen, um zu versuchen, sie abzumildern. Sie testeten das Modell an Bevölkerungsgruppen, die in ihren Trainingssets unterrepräsentiert waren – eine Krankenschwester, ein weiblicher CEO usw. Dies ist eine aktive Herangehensweise an h ...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow