Meta створює штучний інтелект для перевірки фактів у Вікіпедії – усі 6,5 мільйона статей

Більшість людей старше 30, мабуть, пам’ятають, як досліджували старі добрі енциклопедії. Ви дістаєте з полиці великий том, перевіряєте покажчик на тему, яка вас цікавить, потім повертаєтеся до відповідної сторінки й починаєте читати. Це було не так просто, як ввести кілька слів у рядок пошуку Google, але, з іншого боку, ви знали, що інформація, яку ви знаходите на сторінках Britannica або World Book було точним і правдивим.

Це не стосується сьогоднішніх інтернет-досліджень. Переважна кількість джерел досить заплутала, але додайте поширення дезінформації, і дивно, що хтось із нас повірив слову, яке прочитав в Інтернеті.

Вікіпедія є хорошим прикладом. На початку 2020 року англійська версія сайту мала в середньому близько 255 мільйонів переглядів сторінок на день, що робило її восьмим за відвідуваністю веб-сайтом в Інтернеті. З минулого місяця він піднявся на сьоме місце, а англійська версія наразі містить понад 6,5 мільйонів статей.

Але яким би важливим не було це джерело інформації, його точність залишає бажати кращого; на сторінці надійності сайту зазначено: «Онлайн-енциклопедія не вважає себе надійним джерелом і не заохочує читачів використовувати її в академічному чи дослідницькому контексті».

Мета — зі старого Facebook — хоче це змінити. У публікації в блозі, опублікованій минулого місяця, співробітники компанії описують, як ШІ може допомогти зробити Вікіпедію точнішою.

Хоча десятки тисяч людей беруть участь у редагуванні сайту, факти, які вони додають, не обов’язково правильні; навіть якщо цитати є, вони не завжди точні чи навіть доречні.

Meta розробляє модель машинного навчання, яка аналізує ці цитати та повертає їхній вміст до статей Вікіпедії, щоб перевірити не лише відповідність тем, а й точність наведених цифр.

Це не просто вибір чисел і переконання, що вони збігаються; ШІ Meta повинен буде «розуміти» зміст цитованих джерел (хоча «розуміти» є неправильним словосполученням, як сказала б дослідниця теорії складності Мелані Мітчелл, оскільки ШІ все ще перебуває на «вузькій» фазі, що означає, що це дуже складний шаблон інструмент розпізнавання, тоді як «розуміння» – це слово, яке використовується для людського пізнання, що знову ж таки зовсім інше).

Модель Meta «розуміє» вміст не шляхом порівняння рядків тексту та переконання, що вони містять однакові слова, а шляхом порівняння математичних представлень блоків тексту, які їй вдається за допомогою техніки розуміння природної мови (NLU).

«Ми створили індекс усіх цих веб-сторінок, розділивши їх на уривки та забезпечивши точне представлення кожного уривка», — сказав Фабіо Петроні, технічний директор із фундаментальних досліджень AI у Meta, на < em>Цифрові тенденції. «Справа не в тому, щоб слово в слово представити уривок, а в значенні уривка. Це означає, що два фрагменти тексту зі схожими значеннями будуть представлені в дуже близькому місці в отриманому n-вимірному просторі, де зберігаються всі ці уривки. »

Штучний інтелект навчається на наборі з чотирьох мільйонів цитат у Вікіпедії, і окрім вибору неправильних цитат на сайті, його творці хотіли б, щоб він, можливо, запропонував точні джерела, щоб зайняти їхнє місце, спираючись на величезний індекс постійно оновлюваних даних.

Велика проблема, яку ще належить вирішити, це робота в системі оцінювання надійності джерел. Стаття з наукового журналу, наприклад, отримає вищу оцінку, ніж публікація в блозі. Обсяг вмісту в Інтернеті настільки великий і різноманітний, що ви можете знайти «джерела», щоб підтвердити майже будь-яку заяву, але аналізуючи дезінформацію дезінформації (перша означає неправильну, тоді як друга означає навмисне введення в оману) і перевірені експертами того, що не було рецензовано експертами, того, що було перевірено поспішно, це непросте завдання, але це дуже важливе завдання, коли йдеться про впевненість.

Meta відкрила свою модель, і ті, кому цікаво, можуть побачити демонстрацію інструменту перевірки. У дописі в блозі Meta зазначено, що компанія не співпрацює з Wikimedia у цьому проекті, і що він все ще знаходиться на стадії дослідження і не є поточним...

Meta створює штучний інтелект для перевірки фактів у Вікіпедії – усі 6,5 мільйона статей

Більшість людей старше 30, мабуть, пам’ятають, як досліджували старі добрі енциклопедії. Ви дістаєте з полиці великий том, перевіряєте покажчик на тему, яка вас цікавить, потім повертаєтеся до відповідної сторінки й починаєте читати. Це було не так просто, як ввести кілька слів у рядок пошуку Google, але, з іншого боку, ви знали, що інформація, яку ви знаходите на сторінках Britannica або World Book було точним і правдивим.

Це не стосується сьогоднішніх інтернет-досліджень. Переважна кількість джерел досить заплутала, але додайте поширення дезінформації, і дивно, що хтось із нас повірив слову, яке прочитав в Інтернеті.

Вікіпедія є хорошим прикладом. На початку 2020 року англійська версія сайту мала в середньому близько 255 мільйонів переглядів сторінок на день, що робило її восьмим за відвідуваністю веб-сайтом в Інтернеті. З минулого місяця він піднявся на сьоме місце, а англійська версія наразі містить понад 6,5 мільйонів статей.

Але яким би важливим не було це джерело інформації, його точність залишає бажати кращого; на сторінці надійності сайту зазначено: «Онлайн-енциклопедія не вважає себе надійним джерелом і не заохочує читачів використовувати її в академічному чи дослідницькому контексті».

Мета — зі старого Facebook — хоче це змінити. У публікації в блозі, опублікованій минулого місяця, співробітники компанії описують, як ШІ може допомогти зробити Вікіпедію точнішою.

Хоча десятки тисяч людей беруть участь у редагуванні сайту, факти, які вони додають, не обов’язково правильні; навіть якщо цитати є, вони не завжди точні чи навіть доречні.

Meta розробляє модель машинного навчання, яка аналізує ці цитати та повертає їхній вміст до статей Вікіпедії, щоб перевірити не лише відповідність тем, а й точність наведених цифр.

Це не просто вибір чисел і переконання, що вони збігаються; ШІ Meta повинен буде «розуміти» зміст цитованих джерел (хоча «розуміти» є неправильним словосполученням, як сказала б дослідниця теорії складності Мелані Мітчелл, оскільки ШІ все ще перебуває на «вузькій» фазі, що означає, що це дуже складний шаблон інструмент розпізнавання, тоді як «розуміння» – це слово, яке використовується для людського пізнання, що знову ж таки зовсім інше).

Модель Meta «розуміє» вміст не шляхом порівняння рядків тексту та переконання, що вони містять однакові слова, а шляхом порівняння математичних представлень блоків тексту, які їй вдається за допомогою техніки розуміння природної мови (NLU).

«Ми створили індекс усіх цих веб-сторінок, розділивши їх на уривки та забезпечивши точне представлення кожного уривка», — сказав Фабіо Петроні, технічний директор із фундаментальних досліджень AI у Meta, на < em>Цифрові тенденції. «Справа не в тому, щоб слово в слово представити уривок, а в значенні уривка. Це означає, що два фрагменти тексту зі схожими значеннями будуть представлені в дуже близькому місці в отриманому n-вимірному просторі, де зберігаються всі ці уривки. »

Штучний інтелект навчається на наборі з чотирьох мільйонів цитат у Вікіпедії, і окрім вибору неправильних цитат на сайті, його творці хотіли б, щоб він, можливо, запропонував точні джерела, щоб зайняти їхнє місце, спираючись на величезний індекс постійно оновлюваних даних.

Велика проблема, яку ще належить вирішити, це робота в системі оцінювання надійності джерел. Стаття з наукового журналу, наприклад, отримає вищу оцінку, ніж публікація в блозі. Обсяг вмісту в Інтернеті настільки великий і різноманітний, що ви можете знайти «джерела», щоб підтвердити майже будь-яку заяву, але аналізуючи дезінформацію дезінформації (перша означає неправильну, тоді як друга означає навмисне введення в оману) і перевірені експертами того, що не було рецензовано експертами, того, що було перевірено поспішно, це непросте завдання, але це дуже важливе завдання, коли йдеться про впевненість.

Meta відкрила свою модель, і ті, кому цікаво, можуть побачити демонстрацію інструменту перевірки. У дописі в блозі Meta зазначено, що компанія не співпрацює з Wikimedia у цьому проекті, і що він все ще знаходиться на стадії дослідження і не є поточним...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow