Основні моделі: зміна парадигми ШІ 2022 року

Не змогли відвідати Transform 2022? Перегляньте всі сесії саміту в нашій бібліотеці за запитом! Подивіться сюди.

У 2022 році відбулося неймовірне зростання базових моделей – моделей штучного інтелекту, навчених у масштабі – революція, яка почалася з BERT від Google у 2018 році, прискорилася з GPT-3 від OpenAI у 2020 році та ввійшла в дух часу з DALL-Electronic від компанії Text to Image Generator на початку 2021 року.

Темп лише прискорився цього року й міцно ввійшов у мейнстрім завдяки вражаючим можливостям перетворення тексту в зображення DALL-E 2, Imagen і Midjourney від Google, а також лише опціям для програм комп’ютерного бачення від Florence від Microsoft і мультимодальних варіантів від Gato від Deep Mind.

Ця прискорена швидкість розвитку та супутні етичні занепокоєння щодо упередженості моделей є причиною, чому рік тому Стенфордський інститут людиноорієнтованого штучного інтелекту заснував Центр дослідження моделей фундаментів (CRFM) і опублікував «Про можливості та ризики моделей фундаментів». ” — звіт, який назвав цю потужну трансформацію.

«Ми ввели термін «базові моделі», тому що відчували, що потрібна назва, щоб висвітлити важливість цього набору технологій», — сказав Персі Лянг, доцент кафедри комп’ютерних наук Стенфордського університету та директор CRFM.

Подія

MetaBeat 2022

4 жовтня в Сан-Франциско, штат Каліфорнія, MetaBeat збере лідерів думок, щоб порадити, як технологія метавсесвіту змінить спосіб спілкування та ведення бізнесу в усіх галузях.

зареєструватися тут

З тих пір удосконалення моделей основи «зробило нас більш впевненими, що це було правильне рішення», додав він. Однак це також призвело до зростання потреби в прозорості, яку, за його словами, важко задовольнити.

«Існує плутанина щодо того, що насправді являють собою ці моделі та що вони роблять», — сказав Ліанг, додавши, що темпи розробки моделей були настільки швидкими, що багато базових моделей уже на ринку або недоопрацьовані спеціальні системи, громадськість не знає, наприклад дослідження.

«Ми намагаємося зрозуміти екосистему, документувати та порівнювати все, що відбувається», — сказав він.

Основним моделям бракує прозорості

CRFM визначає базову модель як модель, навчену на загальних даних, яку можна адаптувати до широкого спектру подальших завдань.

«Це єдина модель, як дуже універсальний фреймворк», — сказав Лян, що різко контрастує з моделями попереднього покоління, які створювали спеціальні моделі для різних програм.

«Це зміна парадигми створення програм», — пояснив він. «Ви можете створювати будь-які круті додатки, які були просто неможливими або, принаймні, займали місяці величезної команди інженерів».

Фундаментальні шаблони, такі як DALL-E та GPT-3, пропонують нові творчі можливості, а також нові способи взаємодії із системами, сказав Ріші Боммасані, доктор філософії. студент кафедри комп’ютерних наук у Стенфорді, чиї дослідження зосереджені на базових моделях.

«Одна з речей, яку ми бачимо в мові, баченні та коді, полягає в тому, що ці системи можуть знизити бар’єр входу...

Основні моделі: зміна парадигми ШІ 2022 року

Не змогли відвідати Transform 2022? Перегляньте всі сесії саміту в нашій бібліотеці за запитом! Подивіться сюди.

У 2022 році відбулося неймовірне зростання базових моделей – моделей штучного інтелекту, навчених у масштабі – революція, яка почалася з BERT від Google у 2018 році, прискорилася з GPT-3 від OpenAI у 2020 році та ввійшла в дух часу з DALL-Electronic від компанії Text to Image Generator на початку 2021 року.

Темп лише прискорився цього року й міцно ввійшов у мейнстрім завдяки вражаючим можливостям перетворення тексту в зображення DALL-E 2, Imagen і Midjourney від Google, а також лише опціям для програм комп’ютерного бачення від Florence від Microsoft і мультимодальних варіантів від Gato від Deep Mind.

Ця прискорена швидкість розвитку та супутні етичні занепокоєння щодо упередженості моделей є причиною, чому рік тому Стенфордський інститут людиноорієнтованого штучного інтелекту заснував Центр дослідження моделей фундаментів (CRFM) і опублікував «Про можливості та ризики моделей фундаментів». ” — звіт, який назвав цю потужну трансформацію.

«Ми ввели термін «базові моделі», тому що відчували, що потрібна назва, щоб висвітлити важливість цього набору технологій», — сказав Персі Лянг, доцент кафедри комп’ютерних наук Стенфордського університету та директор CRFM.

Подія

MetaBeat 2022

4 жовтня в Сан-Франциско, штат Каліфорнія, MetaBeat збере лідерів думок, щоб порадити, як технологія метавсесвіту змінить спосіб спілкування та ведення бізнесу в усіх галузях.

зареєструватися тут

З тих пір удосконалення моделей основи «зробило нас більш впевненими, що це було правильне рішення», додав він. Однак це також призвело до зростання потреби в прозорості, яку, за його словами, важко задовольнити.

«Існує плутанина щодо того, що насправді являють собою ці моделі та що вони роблять», — сказав Ліанг, додавши, що темпи розробки моделей були настільки швидкими, що багато базових моделей уже на ринку або недоопрацьовані спеціальні системи, громадськість не знає, наприклад дослідження.

«Ми намагаємося зрозуміти екосистему, документувати та порівнювати все, що відбувається», — сказав він.

Основним моделям бракує прозорості

CRFM визначає базову модель як модель, навчену на загальних даних, яку можна адаптувати до широкого спектру подальших завдань.

«Це єдина модель, як дуже універсальний фреймворк», — сказав Лян, що різко контрастує з моделями попереднього покоління, які створювали спеціальні моделі для різних програм.

«Це зміна парадигми створення програм», — пояснив він. «Ви можете створювати будь-які круті додатки, які були просто неможливими або, принаймні, займали місяці величезної команди інженерів».

Фундаментальні шаблони, такі як DALL-E та GPT-3, пропонують нові творчі можливості, а також нові способи взаємодії із системами, сказав Ріші Боммасані, доктор філософії. студент кафедри комп’ютерних наук у Стенфорді, чиї дослідження зосереджені на базових моделях.

«Одна з речей, яку ми бачимо в мові, баченні та коді, полягає в тому, що ці системи можуть знизити бар’єр входу...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow