Секретний соус Generative AI – зчитування даних – піддається атаці
Приєднайтеся до керівників вищої ланки в Сан-Франциско 11-12 липня та дізнайтеся, як бізнес-лідери випереджають генеративну революцію ШІ. Дізнайтеся більше
Веб-збирання величезних обсягів даних можна назвати секретним соусом генеративного ШІ. Зрештою, такі чат-боти зі штучним інтелектом, як ChatGPT, Claude, Bard і LLaMA, можуть видавати зв’язний текст, тому що вони навчалися на величезних масивах даних, здебільшого отриманих з Інтернету. І оскільки розмір сучасних LLM, як-от GPT-4, збільшився до сотень мільярдів токенів, зросла й жага даних.
Протягом останнього тижня методи відновлення даних задля навчання штучного інтелекту зазнали нападів з багатьох фронтів. Проти OpenAI було порушено два позови. Одна, подана до федерального суду в Сан-Франциско, стверджує, що OpenAI незаконно скопіював текст із книги, не отримавши згоди від власників авторських прав або пропонуючи їм кредит і компенсацію. Інший стверджує, що ChatGPT і DALL·E OpenAI збирають особисті дані користувачів з Інтернету, порушуючи закони про конфіденційність.
Твіттер також був у новинах про збирання даних, але цього разу він прагнув захистити свої дані, обмеживши доступ. Щоб обмежити наслідки збору даних AI, Twitter тимчасово заблокував людей, які не ввійшли в систему, переглядати твіти на платформі соціальних мереж, а також встановив обмеження пропускної здатності для кількості твітів, які можна переглянути.
>>Слідкуйте за новинами VentureBeat щодо генеративного штучного інтелекту
![Секретний соус Generative AI – зчитування даних – піддається атаці](https://venturebeat.com/wp-content/uploads/2023/07/Untitled-design-2023-07-06T120228.476.png?w=1200&strip=all)
Приєднайтеся до керівників вищої ланки в Сан-Франциско 11-12 липня та дізнайтеся, як бізнес-лідери випереджають генеративну революцію ШІ. Дізнайтеся більше
Веб-збирання величезних обсягів даних можна назвати секретним соусом генеративного ШІ. Зрештою, такі чат-боти зі штучним інтелектом, як ChatGPT, Claude, Bard і LLaMA, можуть видавати зв’язний текст, тому що вони навчалися на величезних масивах даних, здебільшого отриманих з Інтернету. І оскільки розмір сучасних LLM, як-от GPT-4, збільшився до сотень мільярдів токенів, зросла й жага даних.
Протягом останнього тижня методи відновлення даних задля навчання штучного інтелекту зазнали нападів з багатьох фронтів. Проти OpenAI було порушено два позови. Одна, подана до федерального суду в Сан-Франциско, стверджує, що OpenAI незаконно скопіював текст із книги, не отримавши згоди від власників авторських прав або пропонуючи їм кредит і компенсацію. Інший стверджує, що ChatGPT і DALL·E OpenAI збирають особисті дані користувачів з Інтернету, порушуючи закони про конфіденційність.
Твіттер також був у новинах про збирання даних, але цього разу він прагнув захистити свої дані, обмеживши доступ. Щоб обмежити наслідки збору даних AI, Twitter тимчасово заблокував людей, які не ввійшли в систему, переглядати твіти на платформі соціальних мереж, а також встановив обмеження пропускної здатності для кількості твітів, які можна переглянути.
>>Слідкуйте за новинами VentureBeat щодо генеративного штучного інтелекту
What's Your Reaction?
![like](https://vidianews.com/assets/img/reactions/like.png)
![dislike](https://vidianews.com/assets/img/reactions/dislike.png)
![love](https://vidianews.com/assets/img/reactions/love.png)
![funny](https://vidianews.com/assets/img/reactions/funny.png)
![angry](https://vidianews.com/assets/img/reactions/angry.png)
![sad](https://vidianews.com/assets/img/reactions/sad.png)
![wow](https://vidianews.com/assets/img/reactions/wow.png)