Секретний соус Generative AI – зчитування даних – піддається атаці

Приєднайтеся до керівників вищої ланки в Сан-Франциско 11-12 липня та дізнайтеся, як бізнес-лідери випереджають генеративну революцію ШІ. Дізнайтеся більше

Веб-збирання величезних обсягів даних можна назвати секретним соусом генеративного ШІ. Зрештою, такі чат-боти зі штучним інтелектом, як ChatGPT, Claude, Bard і LLaMA, можуть видавати зв’язний текст, тому що вони навчалися на величезних масивах даних, здебільшого отриманих з Інтернету. І оскільки розмір сучасних LLM, як-от GPT-4, збільшився до сотень мільярдів токенів, зросла й жага даних.

Протягом останнього тижня методи відновлення даних задля навчання штучного інтелекту зазнали нападів з багатьох фронтів. Проти OpenAI було порушено два позови. Одна, подана до федерального суду в Сан-Франциско, стверджує, що OpenAI незаконно скопіював текст із книги, не отримавши згоди від власників авторських прав або пропонуючи їм кредит і компенсацію. Інший стверджує, що ChatGPT і DALL·E OpenAI збирають особисті дані користувачів з Інтернету, порушуючи закони про конфіденційність.

Твіттер також був у новинах про збирання даних, але цього разу він прагнув захистити свої дані, обмеживши доступ. Щоб обмежити наслідки збору даних AI, Twitter тимчасово заблокував людей, які не ввійшли в систему, переглядати твіти на платформі соціальних мереж, а також встановив обмеження пропускної здатності для кількості твітів, які можна переглянути.

>>Слідкуйте за новинами VentureBeat щодо генеративного штучного інтелекту

Секретний соус Generative AI – зчитування даних – піддається атаці

Приєднайтеся до керівників вищої ланки в Сан-Франциско 11-12 липня та дізнайтеся, як бізнес-лідери випереджають генеративну революцію ШІ. Дізнайтеся більше

Веб-збирання величезних обсягів даних можна назвати секретним соусом генеративного ШІ. Зрештою, такі чат-боти зі штучним інтелектом, як ChatGPT, Claude, Bard і LLaMA, можуть видавати зв’язний текст, тому що вони навчалися на величезних масивах даних, здебільшого отриманих з Інтернету. І оскільки розмір сучасних LLM, як-от GPT-4, збільшився до сотень мільярдів токенів, зросла й жага даних.

Протягом останнього тижня методи відновлення даних задля навчання штучного інтелекту зазнали нападів з багатьох фронтів. Проти OpenAI було порушено два позови. Одна, подана до федерального суду в Сан-Франциско, стверджує, що OpenAI незаконно скопіював текст із книги, не отримавши згоди від власників авторських прав або пропонуючи їм кредит і компенсацію. Інший стверджує, що ChatGPT і DALL·E OpenAI збирають особисті дані користувачів з Інтернету, порушуючи закони про конфіденційність.

Твіттер також був у новинах про збирання даних, але цього разу він прагнув захистити свої дані, обмеживши доступ. Щоб обмежити наслідки збору даних AI, Twitter тимчасово заблокував людей, які не ввійшли в систему, переглядати твіти на платформі соціальних мереж, а також встановив обмеження пропускної здатності для кількості твітів, які можна переглянути.

>>Слідкуйте за новинами VentureBeat щодо генеративного штучного інтелекту

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow