Побудова інклюзивного НЛП

Перегляньте всі сеанси Smart Security Summit за запитом тут.

Мільйони носіїв стандартної англійської мови щодня користуються перевагами моделей обробки природної мови (NLP).

Але для носіїв афроамериканської народної англійської мови (AAVE) такі технології, як голосові GPS-системи, КПК і програмне забезпечення для перетворення тексту в мовлення, часто є проблематичними, оскільки великі моделі NLP часто не можуть зрозуміти або створити слова в AAVE. . Що ще гірше, моделі часто навчаються на даних, отриманих з Інтернету, і, ймовірно, впроваджують расові упередження та стереотипні асоціації, поширені в Інтернеті.

Коли ці упереджені моделі використовуються компаніями для прийняття важливих рішень, доповідачі AAVE можуть виявитися несправедливо виключеними з соціальних мереж, неналежним чином позбавленими доступу до житла чи можливостей позики або несправедливого ставлення з боку правоохоронних органів чи правосуддя системи.

Протягом останніх 18 місяців спеціаліст з машинного навчання (ML) Джазмія Генрі зосереджувалася на пошуку способу відповідальної інтеграції AAVE у мовні моделі. Як співробітник Стенфордського інституту штучного інтелекту, орієнтованого на людину (HAI) і Центру порівняльних досліджень расової та етнічної приналежності (CCSRE), вона створила корпус із відкритим кодом із понад 141 000 слів AAVE, щоб допомогти дослідникам і виробникам розробляти моделі. які є всеохоплюючими та мають меншу ймовірність упередженості.

Подія

Саміт Smart Security за запитом

Дізнайтеся про важливу роль штучного інтелекту та машинного навчання в кібербезпеці та практичні приклади для окремих галузей. Дивіться сеанси за запитом сьогодні.

Послухайте

«Я сподіваюся, що завдяки цьому проекту соціальні та комп’ютерні лінгвісти, антропологи, інформатики, соціологи та інші дослідники будуть наполягати на цьому корпусі, досліджувати його, боротися з ним і перевіряти його межі, щоб ми могли перетворіть це на справжнє представлення AAVE та надайте зворотний зв’язок та інформацію про наші потенційні наступні кроки алгоритмічно», – сказав Генрі.

У цьому інтерв’ю вона описує перші перешкоди на шляху розробки цієї бази даних, її потенціал допомогти комп’ютерній лінгвістиці зрозуміти походження AAVE та її проекти після Стенфордського університету.

Як би ви описали афроамериканську народну англійську?

Для мене AAVE — це мова наполегливості та підвищення. Це результат того, що африканські мови, які, як вважають, були втрачені під час міграції работоргівлі, були об’єднані з англійською для створення нової мови, якою користуються нащадки цих африканських народів.

Як ви зацікавилися включенням AAVE в моделі НЛП?

У дитинстві обоє моїх батьків інколи розмовляли рідною мовою. Для мого вест-індійського тата це була ямайська мова, а для моєї мами — гулла гічі, яку можна знайти в прибережних районах Кароліни та Джорджії. Кожна мова була креольською, тобто новою мовою, створеною шляхом змішування різних мов.

Здавалося, усі розуміли, що мої батьки розмовляли іншою мовою, і ніхто не сумнівався в їх розумі. Але коли я побачив, що люди в моїй спільноті розмовляють мовою AAVE, яка, як я вважаю, ще однією креольською мовою, я зрозумів, що це сором і стигма, пов’язані з цим – відчуття, що якщо ми будемо використовувати цю мову назовні, то будемо визнаний менш розумним. Коли я почав працювати в галузі науки про дані, мені було цікаво, що станеться, якщо я спробую зібрати дані на AAVE і включити їх у

Побудова інклюзивного НЛП

Перегляньте всі сеанси Smart Security Summit за запитом тут.

Мільйони носіїв стандартної англійської мови щодня користуються перевагами моделей обробки природної мови (NLP).

Але для носіїв афроамериканської народної англійської мови (AAVE) такі технології, як голосові GPS-системи, КПК і програмне забезпечення для перетворення тексту в мовлення, часто є проблематичними, оскільки великі моделі NLP часто не можуть зрозуміти або створити слова в AAVE. . Що ще гірше, моделі часто навчаються на даних, отриманих з Інтернету, і, ймовірно, впроваджують расові упередження та стереотипні асоціації, поширені в Інтернеті.

Коли ці упереджені моделі використовуються компаніями для прийняття важливих рішень, доповідачі AAVE можуть виявитися несправедливо виключеними з соціальних мереж, неналежним чином позбавленими доступу до житла чи можливостей позики або несправедливого ставлення з боку правоохоронних органів чи правосуддя системи.

Протягом останніх 18 місяців спеціаліст з машинного навчання (ML) Джазмія Генрі зосереджувалася на пошуку способу відповідальної інтеграції AAVE у мовні моделі. Як співробітник Стенфордського інституту штучного інтелекту, орієнтованого на людину (HAI) і Центру порівняльних досліджень расової та етнічної приналежності (CCSRE), вона створила корпус із відкритим кодом із понад 141 000 слів AAVE, щоб допомогти дослідникам і виробникам розробляти моделі. які є всеохоплюючими та мають меншу ймовірність упередженості.

Подія

Саміт Smart Security за запитом

Дізнайтеся про важливу роль штучного інтелекту та машинного навчання в кібербезпеці та практичні приклади для окремих галузей. Дивіться сеанси за запитом сьогодні.

Послухайте

«Я сподіваюся, що завдяки цьому проекту соціальні та комп’ютерні лінгвісти, антропологи, інформатики, соціологи та інші дослідники будуть наполягати на цьому корпусі, досліджувати його, боротися з ним і перевіряти його межі, щоб ми могли перетворіть це на справжнє представлення AAVE та надайте зворотний зв’язок та інформацію про наші потенційні наступні кроки алгоритмічно», – сказав Генрі.

У цьому інтерв’ю вона описує перші перешкоди на шляху розробки цієї бази даних, її потенціал допомогти комп’ютерній лінгвістиці зрозуміти походження AAVE та її проекти після Стенфордського університету.

Як би ви описали афроамериканську народну англійську?

Для мене AAVE — це мова наполегливості та підвищення. Це результат того, що африканські мови, які, як вважають, були втрачені під час міграції работоргівлі, були об’єднані з англійською для створення нової мови, якою користуються нащадки цих африканських народів.

Як ви зацікавилися включенням AAVE в моделі НЛП?

У дитинстві обоє моїх батьків інколи розмовляли рідною мовою. Для мого вест-індійського тата це була ямайська мова, а для моєї мами — гулла гічі, яку можна знайти в прибережних районах Кароліни та Джорджії. Кожна мова була креольською, тобто новою мовою, створеною шляхом змішування різних мов.

Здавалося, усі розуміли, що мої батьки розмовляли іншою мовою, і ніхто не сумнівався в їх розумі. Але коли я побачив, що люди в моїй спільноті розмовляють мовою AAVE, яка, як я вважаю, ще однією креольською мовою, я зрозумів, що це сором і стигма, пов’язані з цим – відчуття, що якщо ми будемо використовувати цю мову назовні, то будемо визнаний менш розумним. Коли я почав працювати в галузі науки про дані, мені було цікаво, що станеться, якщо я спробую зібрати дані на AAVE і включити їх у

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow