Aufbau eines inklusiven NLP

Sehen Sie sich hier alle On-Demand-Sitzungen des Smart Security Summit an.

Millionen Standard-Englischsprecher genießen jeden Tag die Vorteile, die Modelle zur Verarbeitung natürlicher Sprache (NLP) bieten.

Aber für Sprecher des African American Vernacular English (AAVE) sind Technologien wie sprachgesteuerte GPS-Systeme, PDAs und Text-to-Speech-Software oft problematisch, da große NLP-Modelle oft nicht in der Lage sind, Wörter zu verstehen oder zu erzeugen AAVE. . Schlimmer noch, die Modelle werden oft mit Daten trainiert, die aus dem Internet gezogen werden, und werden wahrscheinlich die rassistischen Vorurteile und stereotypen Assoziationen einbetten, die online weit verbreitet sind.

Wenn diese voreingenommenen Modelle von Unternehmen verwendet werden, um wichtige Entscheidungen zu treffen, werden AAVE-Sprecher möglicherweise unfairerweise von sozialen Netzwerken ausgeschlossen, ihnen wird unangemessen der Zugang zu Wohnraum oder Kreditmöglichkeiten verweigert oder sie werden von Strafverfolgungsbehörden oder der Justiz unfair behandelt Systeme.

In den letzten 18 Monaten hat sich Jazmia Henry, Expertin für maschinelles Lernen (ML), darauf konzentriert, einen Weg zu finden, AAVE verantwortungsbewusst in Sprachmodelle zu integrieren. Als Fellow am Stanford Institute for Human-Centered Artificial Intelligence (HAI) und am Center for Comparative Studies in Race and Ethnicity (CCSRE) erstellte sie ein Open-Source-Korpus mit über 141.000 AAVE-Wörtern, um Forschern und Herstellern beim Entwerfen von Modellen zu helfen die sowohl integrativ als auch weniger wahrscheinlich voreingenommen sind.

Fall

Smart Security Summit auf Abruf

Erfahren Sie mehr über die wesentliche Rolle von KI und ML in der Cybersicherheit und branchenspezifische Fallstudien. Sehen Sie sich noch heute die On-Demand-Sitzungen an.

Schau hier

"Meine Hoffnung bei diesem Projekt ist, dass Sozial- und Computerlinguisten, Anthropologen, Informatiker, Sozialwissenschaftler und andere Forscher dieses Korpus vorantreiben, damit forschen, damit ringen und seine Grenzen testen, damit wir es können Verwandeln Sie dies in eine echte Darstellung von AAVE und liefern Sie algorithmisch Feedback und Informationen zu unseren potenziellen nächsten Schritten“, sagte Henry.

In diesem Interview beschreibt sie die frühen Hürden bei der Entwicklung dieser Datenbank, ihr Potenzial, der Computerlinguistik dabei zu helfen, die Ursprünge von AAVE zu verstehen, und ihre Post-Stanford-Projekte.

Wie würden Sie afroamerikanisches Vernacular English beschreiben?

Für mich ist AAVE eine Sprache der Beharrlichkeit und Erhabenheit. Es ist das Ergebnis afrikanischer Sprachen, von denen angenommen wird, dass sie während der Migration des Sklavenhandels verloren gegangen sind, die in Englisch integriert wurden, um eine neue Sprache zu schaffen, die von den Nachkommen dieser afrikanischen Völker verwendet wird.

Wie entstand Ihr Interesse daran, AAVE in NLP-Modelle einzubeziehen?

Als Kind sprachen meine Eltern manchmal ihre Muttersprache. Für meinen westindischen Vater war es jamaikanisches Patois, und für meine Mutter war es Gullah Geechee, das in den Küstengebieten von Carolinas und Georgia gefunden wurde. Jede Sprache war ein Kreolisch, eine neue Sprache, die durch Mischen verschiedener Sprachen entstanden ist.

Jeder schien zu verstehen, dass meine Eltern eine andere Sprache sprachen, und niemand zweifelte an ihrer Intelligenz. Aber als ich Leute in meiner Gemeinde sah, die AAVE sprachen, was meiner Meinung nach eine andere kreolische Sprache ist, konnte ich erkennen, dass damit eine Scham und Stigmatisierung verbunden war – ein Gefühl, dass wir es sein würden, wenn wir diese Sprache nach außen verwenden würden als weniger intelligent eingeschätzt. Als ich anfing, in der Datenwissenschaft zu arbeiten, fragte ich mich, was passieren würde, wenn ich versuchen würde, Daten auf AAVE zu sammeln und darin zu integrieren

Aufbau eines inklusiven NLP

Sehen Sie sich hier alle On-Demand-Sitzungen des Smart Security Summit an.

Millionen Standard-Englischsprecher genießen jeden Tag die Vorteile, die Modelle zur Verarbeitung natürlicher Sprache (NLP) bieten.

Aber für Sprecher des African American Vernacular English (AAVE) sind Technologien wie sprachgesteuerte GPS-Systeme, PDAs und Text-to-Speech-Software oft problematisch, da große NLP-Modelle oft nicht in der Lage sind, Wörter zu verstehen oder zu erzeugen AAVE. . Schlimmer noch, die Modelle werden oft mit Daten trainiert, die aus dem Internet gezogen werden, und werden wahrscheinlich die rassistischen Vorurteile und stereotypen Assoziationen einbetten, die online weit verbreitet sind.

Wenn diese voreingenommenen Modelle von Unternehmen verwendet werden, um wichtige Entscheidungen zu treffen, werden AAVE-Sprecher möglicherweise unfairerweise von sozialen Netzwerken ausgeschlossen, ihnen wird unangemessen der Zugang zu Wohnraum oder Kreditmöglichkeiten verweigert oder sie werden von Strafverfolgungsbehörden oder der Justiz unfair behandelt Systeme.

In den letzten 18 Monaten hat sich Jazmia Henry, Expertin für maschinelles Lernen (ML), darauf konzentriert, einen Weg zu finden, AAVE verantwortungsbewusst in Sprachmodelle zu integrieren. Als Fellow am Stanford Institute for Human-Centered Artificial Intelligence (HAI) und am Center for Comparative Studies in Race and Ethnicity (CCSRE) erstellte sie ein Open-Source-Korpus mit über 141.000 AAVE-Wörtern, um Forschern und Herstellern beim Entwerfen von Modellen zu helfen die sowohl integrativ als auch weniger wahrscheinlich voreingenommen sind.

Fall

Smart Security Summit auf Abruf

Erfahren Sie mehr über die wesentliche Rolle von KI und ML in der Cybersicherheit und branchenspezifische Fallstudien. Sehen Sie sich noch heute die On-Demand-Sitzungen an.

Schau hier

"Meine Hoffnung bei diesem Projekt ist, dass Sozial- und Computerlinguisten, Anthropologen, Informatiker, Sozialwissenschaftler und andere Forscher dieses Korpus vorantreiben, damit forschen, damit ringen und seine Grenzen testen, damit wir es können Verwandeln Sie dies in eine echte Darstellung von AAVE und liefern Sie algorithmisch Feedback und Informationen zu unseren potenziellen nächsten Schritten“, sagte Henry.

In diesem Interview beschreibt sie die frühen Hürden bei der Entwicklung dieser Datenbank, ihr Potenzial, der Computerlinguistik dabei zu helfen, die Ursprünge von AAVE zu verstehen, und ihre Post-Stanford-Projekte.

Wie würden Sie afroamerikanisches Vernacular English beschreiben?

Für mich ist AAVE eine Sprache der Beharrlichkeit und Erhabenheit. Es ist das Ergebnis afrikanischer Sprachen, von denen angenommen wird, dass sie während der Migration des Sklavenhandels verloren gegangen sind, die in Englisch integriert wurden, um eine neue Sprache zu schaffen, die von den Nachkommen dieser afrikanischen Völker verwendet wird.

Wie entstand Ihr Interesse daran, AAVE in NLP-Modelle einzubeziehen?

Als Kind sprachen meine Eltern manchmal ihre Muttersprache. Für meinen westindischen Vater war es jamaikanisches Patois, und für meine Mutter war es Gullah Geechee, das in den Küstengebieten von Carolinas und Georgia gefunden wurde. Jede Sprache war ein Kreolisch, eine neue Sprache, die durch Mischen verschiedener Sprachen entstanden ist.

Jeder schien zu verstehen, dass meine Eltern eine andere Sprache sprachen, und niemand zweifelte an ihrer Intelligenz. Aber als ich Leute in meiner Gemeinde sah, die AAVE sprachen, was meiner Meinung nach eine andere kreolische Sprache ist, konnte ich erkennen, dass damit eine Scham und Stigmatisierung verbunden war – ein Gefühl, dass wir es sein würden, wenn wir diese Sprache nach außen verwenden würden als weniger intelligent eingeschätzt. Als ich anfing, in der Datenwissenschaft zu arbeiten, fragte ich mich, was passieren würde, wenn ich versuchen würde, Daten auf AAVE zu sammeln und darin zu integrieren

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow