Cerebras відкриває нові партнерські відносини для LLM і генеративних інструментів ШІ

Перегляньте сесії за запитом від саміту Low-Code/No-Code Summit, щоб дізнатися, як успішно впроваджувати інновації та підвищувати ефективність шляхом вдосконалення та масштабування громадянських розробників. Переглянути зараз.

Великі мовні моделі (LLM) зараз у моді у світі ШІ, але навчання їх може бути складним і дорогим; моделі з кількома мільярдами параметрів вимагають місяців роботи досвідчених інженерів, щоб працювати (надійно та точно).

Нова спільна пропозиція від Cerebras Systems і Cirrascale Cloud Services спрямована на демократизацію штучного інтелекту, надаючи користувачам можливість навчати моделі класу GPT набагато дешевше, ніж існуючі постачальники, і лише за допомогою кількох рядків коду.

«Ми вважаємо, що магістратури недооцінені», — сказав Ендрю Фельдман, генеральний директор і співзасновник Cerebras Systems, під час попереднього брифінгу. «Протягом наступного року ми побачимо надзвичайне зростання впливу LLM у різних секторах економіки».

Так само генеративний штучний інтелект є, мабуть, одним із найважливіших технологічних досягнень у новітній історії, що дозволяє писати документи, створювати зображення та кодувати програмне забезпечення зі звичайних текстових записів.

Подія

Smart Security Summit

Дізнайтеся про важливу роль штучного інтелекту та машинного навчання в кібербезпеці та галузевих практичних прикладах 8 грудня. Підпишіться на безкоштовний абонемент сьогодні.

Зареєструватися зараз

Щоб прискорити впровадження та підвищити точність генеративного штучного інтелекту, Cerebras також оголосила про нове партнерство з платформою контенту штучного інтелекту Jasper AI.

«Ми справді відчуваємо, що наступною главою генеративного штучного інтелекту є спеціальні моделі, які постійно вдосконалюються», — сказав Дейв Рогенмозер, генеральний директор Jasper.

Перший етап технології був «справді захоплюючим», сказав він, але «ось-ось він стане набагато, набагато захопливішим».

Порівняно з LLM, традиційні хмарні постачальники можуть мати проблеми, оскільки вони не можуть гарантувати затримку між великою кількістю графічних процесорів. Фельдман пояснив, що різна затримка створює складні та трудомісткі проблеми при розподілі великої моделі ШІ між графічними процесорами, і що існують «великі варіації часу для навчання».

Нова студія моделей Cerebras AI Model Studio, яка розміщена в Cirrascale AI Innovation Cloud, дозволяє користувачам навчати моделі Generative Transformer Class (GPT), зокрема GPT-J, GPT-3 і GPT-NeoX, на Cerebras Wafer- Масштабні кластери. Це включає нещодавно анонсований суперкомп’ютер Andromeda AI.

Користувачі можуть вибирати з найсучасніших моделей класу GPT, що варіюються від 1,3 мільярда параметрів до 175 мільярдів параметрів, і навчатися з у вісім разів швидшим часом, ніж на A100, і вдвічі дешевше, ніж у традиційних хмарних постачальників. , - сказав Фельдман.

Наприклад, час навчання GPT-J із традиційною хмарою займає приблизно 64 дні з нуля; Cerebras AI Model Studio скорочує це до восьми днів з нуля. Подібним чином у традиційних хмарах виробничі витрати лише на GPU можуть досягати 61 000 доларів США; у той час як на Cerebras це $45 000 за повний цикл виробництва.

Новий інструмент усуває потребу в devops і розподіленому програмуванні; кнопкова модель оцифрування може варіюватися від одного до 20 мільярдів параметрів. Моделі можна навчати з більшою довжиною послідовності, відкриваючи нові дослідницькі можливості.

«Ми відкриваємо принципово нову можливість пошуку в такому масштабі», — сказав Енді Хок, менеджер із продуктів Cerebras.

Як зазначив Фельдман, місія Cerebras полягає в «розширенні доступу до глибокого навчання та швидкому прискоренні продуктивності робочих навантажень ШІ».

За його словами, його нова модельна студія штучного інтелекту «легка й надзвичайно проста». "Ми організували це так, щоб ви могли на нього стрибати, вказувати, клацати."

Тим часом молодий Jasper (заснований у 2021 році) використовуватиме суперкомп’ютер Andromeda AI від Cerebras для навчання своїх інтенсивних обчислювальних моделей у «частці...

Cerebras відкриває нові партнерські відносини для LLM і генеративних інструментів ШІ

Перегляньте сесії за запитом від саміту Low-Code/No-Code Summit, щоб дізнатися, як успішно впроваджувати інновації та підвищувати ефективність шляхом вдосконалення та масштабування громадянських розробників. Переглянути зараз.

Великі мовні моделі (LLM) зараз у моді у світі ШІ, але навчання їх може бути складним і дорогим; моделі з кількома мільярдами параметрів вимагають місяців роботи досвідчених інженерів, щоб працювати (надійно та точно).

Нова спільна пропозиція від Cerebras Systems і Cirrascale Cloud Services спрямована на демократизацію штучного інтелекту, надаючи користувачам можливість навчати моделі класу GPT набагато дешевше, ніж існуючі постачальники, і лише за допомогою кількох рядків коду.

«Ми вважаємо, що магістратури недооцінені», — сказав Ендрю Фельдман, генеральний директор і співзасновник Cerebras Systems, під час попереднього брифінгу. «Протягом наступного року ми побачимо надзвичайне зростання впливу LLM у різних секторах економіки».

Так само генеративний штучний інтелект є, мабуть, одним із найважливіших технологічних досягнень у новітній історії, що дозволяє писати документи, створювати зображення та кодувати програмне забезпечення зі звичайних текстових записів.

Подія

Smart Security Summit

Дізнайтеся про важливу роль штучного інтелекту та машинного навчання в кібербезпеці та галузевих практичних прикладах 8 грудня. Підпишіться на безкоштовний абонемент сьогодні.

Зареєструватися зараз

Щоб прискорити впровадження та підвищити точність генеративного штучного інтелекту, Cerebras також оголосила про нове партнерство з платформою контенту штучного інтелекту Jasper AI.

«Ми справді відчуваємо, що наступною главою генеративного штучного інтелекту є спеціальні моделі, які постійно вдосконалюються», — сказав Дейв Рогенмозер, генеральний директор Jasper.

Перший етап технології був «справді захоплюючим», сказав він, але «ось-ось він стане набагато, набагато захопливішим».

Порівняно з LLM, традиційні хмарні постачальники можуть мати проблеми, оскільки вони не можуть гарантувати затримку між великою кількістю графічних процесорів. Фельдман пояснив, що різна затримка створює складні та трудомісткі проблеми при розподілі великої моделі ШІ між графічними процесорами, і що існують «великі варіації часу для навчання».

Нова студія моделей Cerebras AI Model Studio, яка розміщена в Cirrascale AI Innovation Cloud, дозволяє користувачам навчати моделі Generative Transformer Class (GPT), зокрема GPT-J, GPT-3 і GPT-NeoX, на Cerebras Wafer- Масштабні кластери. Це включає нещодавно анонсований суперкомп’ютер Andromeda AI.

Користувачі можуть вибирати з найсучасніших моделей класу GPT, що варіюються від 1,3 мільярда параметрів до 175 мільярдів параметрів, і навчатися з у вісім разів швидшим часом, ніж на A100, і вдвічі дешевше, ніж у традиційних хмарних постачальників. , - сказав Фельдман.

Наприклад, час навчання GPT-J із традиційною хмарою займає приблизно 64 дні з нуля; Cerebras AI Model Studio скорочує це до восьми днів з нуля. Подібним чином у традиційних хмарах виробничі витрати лише на GPU можуть досягати 61 000 доларів США; у той час як на Cerebras це $45 000 за повний цикл виробництва.

Новий інструмент усуває потребу в devops і розподіленому програмуванні; кнопкова модель оцифрування може варіюватися від одного до 20 мільярдів параметрів. Моделі можна навчати з більшою довжиною послідовності, відкриваючи нові дослідницькі можливості.

«Ми відкриваємо принципово нову можливість пошуку в такому масштабі», — сказав Енді Хок, менеджер із продуктів Cerebras.

Як зазначив Фельдман, місія Cerebras полягає в «розширенні доступу до глибокого навчання та швидкому прискоренні продуктивності робочих навантажень ШІ».

За його словами, його нова модельна студія штучного інтелекту «легка й надзвичайно проста». "Ми організували це так, щоб ви могли на нього стрибати, вказувати, клацати."

Тим часом молодий Jasper (заснований у 2021 році) використовуватиме суперкомп’ютер Andromeda AI від Cerebras для навчання своїх інтенсивних обчислювальних моделей у «частці...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow