Pourquoi l'humanité est nécessaire pour propulser l'IA conversationnelle

Vous n'avez pas pu assister à Transform 2022 ? Découvrez dès maintenant toutes les sessions du sommet dans notre bibliothèque à la demande ! Regardez ici.

L'IA conversationnelle est un sous-ensemble de l'intelligence artificielle (IA) qui permet aux consommateurs d'interagir avec des applications informatiques comme s'ils interagissaient avec un autre humain. Selon Deloitte, le marché mondial de l'IA conversationnelle devrait croître de 22 % entre 2022 et 2025 et devrait atteindre 14 milliards de dollars d'ici 2025.

Fournissant des personnalisations linguistiques améliorées pour répondre à un groupe très diversifié et vaste d'audiences hyper-locales, de nombreuses applications pratiques incluent les services financiers, les services hospitaliers et les conférences, et peuvent prendre la forme d'une application de traduction ou d'un chatbot. Selon Gartner, 70 % des cols blancs interagissent prétendument régulièrement avec des plates-formes conversationnelles, mais ce n'est qu'une goutte d'eau dans l'océan de ce qui peut se dérouler cette décennie.

Malgré le potentiel passionnant de l'espace de l'IA, il existe un obstacle important ; les données utilisées pour former les modèles d'IA conversationnelle ne tiennent pas suffisamment compte des subtilités du dialecte, de la langue, des modèles de parole et de l'inflexion.

Lors de l'utilisation d'une application de traduction, par exemple, un individu parlera dans sa langue source, et l'IA calculera cette langue source et la convertira dans la langue cible. Lorsque le locuteur source s'écarte d'un accent appris standardisé - par exemple, s'il parle avec un accent régional ou utilise un argot régional - le taux d'efficacité de la traduction en direct diminue. Non seulement cela offre une expérience médiocre, mais cela inhibe également la capacité des utilisateurs à interagir en temps réel, que ce soit avec leurs amis et leur famille ou dans un environnement professionnel.

Événement

MétaBeat 2022

MetaBeat réunira des leaders d'opinion pour donner des conseils sur la manière dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.

Inscrivez-vous ici Le besoin d'humanité dans l'IA

Afin d'éviter une baisse des taux d'efficacité, l'IA doit utiliser un ensemble de données diversifié. Par exemple, cela pourrait inclure une représentation précise des locuteurs à travers le Royaume-Uni - à la fois au niveau régional et national - afin de fournir une meilleure traduction active et d'accélérer l'interaction entre les locuteurs de différentes langues et dialectes.

L'idée d'utiliser les données d'apprentissage dans les programmes de ML est un concept simple, mais il est également fondamental pour le fonctionnement de ces technologies. Les données de formation fonctionnent dans une structure singulière d'apprentissage par renforcement et sont utilisées pour aider un programme à comprendre comment appliquer des technologies telles que les réseaux de neurones pour apprendre et produire des résultats sophistiqués. Plus le bassin de personnes interagissant avec cette technologie sur le back-end est large, par exemple, les locuteurs ayant des troubles de la parole ou des bégaiements, meilleure sera l'expérience de traduction qui en résultera.

Plus précisément dans l'espace de traduction, se concentrer sur comment un utilisateur parle plutôt que de quoi  il parle est la clé pour améliorer l'expérience de l'utilisateur final. Le côté sombre de l'apprentissage par renforcement a été illustré dans des nouvelles récentes avec Meta, qui a récemment été critiqué pour avoir un chatbot qui a craché des commentaires insensibles - qu'il a appris de l'interaction publique. Les données d'entraînement doivent donc toujours avoir un human-in-the-loop (HITL), dans lequel un humain peut s'assurer que l'algorithme global est précis et adapté à l'objectif.

Tenir compte de la nature active de la conversation humaine...

Pourquoi l'humanité est nécessaire pour propulser l'IA conversationnelle

Vous n'avez pas pu assister à Transform 2022 ? Découvrez dès maintenant toutes les sessions du sommet dans notre bibliothèque à la demande ! Regardez ici.

L'IA conversationnelle est un sous-ensemble de l'intelligence artificielle (IA) qui permet aux consommateurs d'interagir avec des applications informatiques comme s'ils interagissaient avec un autre humain. Selon Deloitte, le marché mondial de l'IA conversationnelle devrait croître de 22 % entre 2022 et 2025 et devrait atteindre 14 milliards de dollars d'ici 2025.

Fournissant des personnalisations linguistiques améliorées pour répondre à un groupe très diversifié et vaste d'audiences hyper-locales, de nombreuses applications pratiques incluent les services financiers, les services hospitaliers et les conférences, et peuvent prendre la forme d'une application de traduction ou d'un chatbot. Selon Gartner, 70 % des cols blancs interagissent prétendument régulièrement avec des plates-formes conversationnelles, mais ce n'est qu'une goutte d'eau dans l'océan de ce qui peut se dérouler cette décennie.

Malgré le potentiel passionnant de l'espace de l'IA, il existe un obstacle important ; les données utilisées pour former les modèles d'IA conversationnelle ne tiennent pas suffisamment compte des subtilités du dialecte, de la langue, des modèles de parole et de l'inflexion.

Lors de l'utilisation d'une application de traduction, par exemple, un individu parlera dans sa langue source, et l'IA calculera cette langue source et la convertira dans la langue cible. Lorsque le locuteur source s'écarte d'un accent appris standardisé - par exemple, s'il parle avec un accent régional ou utilise un argot régional - le taux d'efficacité de la traduction en direct diminue. Non seulement cela offre une expérience médiocre, mais cela inhibe également la capacité des utilisateurs à interagir en temps réel, que ce soit avec leurs amis et leur famille ou dans un environnement professionnel.

Événement

MétaBeat 2022

MetaBeat réunira des leaders d'opinion pour donner des conseils sur la manière dont la technologie métaverse transformera la façon dont toutes les industries communiquent et font des affaires le 4 octobre à San Francisco, en Californie.

Inscrivez-vous ici Le besoin d'humanité dans l'IA

Afin d'éviter une baisse des taux d'efficacité, l'IA doit utiliser un ensemble de données diversifié. Par exemple, cela pourrait inclure une représentation précise des locuteurs à travers le Royaume-Uni - à la fois au niveau régional et national - afin de fournir une meilleure traduction active et d'accélérer l'interaction entre les locuteurs de différentes langues et dialectes.

L'idée d'utiliser les données d'apprentissage dans les programmes de ML est un concept simple, mais il est également fondamental pour le fonctionnement de ces technologies. Les données de formation fonctionnent dans une structure singulière d'apprentissage par renforcement et sont utilisées pour aider un programme à comprendre comment appliquer des technologies telles que les réseaux de neurones pour apprendre et produire des résultats sophistiqués. Plus le bassin de personnes interagissant avec cette technologie sur le back-end est large, par exemple, les locuteurs ayant des troubles de la parole ou des bégaiements, meilleure sera l'expérience de traduction qui en résultera.

Plus précisément dans l'espace de traduction, se concentrer sur comment un utilisateur parle plutôt que de quoi  il parle est la clé pour améliorer l'expérience de l'utilisateur final. Le côté sombre de l'apprentissage par renforcement a été illustré dans des nouvelles récentes avec Meta, qui a récemment été critiqué pour avoir un chatbot qui a craché des commentaires insensibles - qu'il a appris de l'interaction publique. Les données d'entraînement doivent donc toujours avoir un human-in-the-loop (HITL), dans lequel un humain peut s'assurer que l'algorithme global est précis et adapté à l'objectif.

Tenir compte de la nature active de la conversation humaine...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow