Чому LLM вразливі до «ефекту метелика»

Гість схід THE шлях ми отримати генеративний ШІ І великий мова моделі (LLM) має говорити має ми Він схід А ст форму в І з себе як ми шукати має отримати ШІ має забезпечити ми з "точний" відповіді.

але Що приблизно варіації? Якщо ми будівництво А швидко А певний шлях, буде він змінити А моделі рішення (І вплив Це є точність)?

THE відповідь: так, відповідно до має дослідження Оскільки THE університет з З півдня Каліфорнія Інформація наук Інститут.

Навіть крихітний Або мабуть нешкідливий коригування — такий як додати А простір має THE початок з А швидко Або надання А директива замість цього що позує А запитання — може причина А магістр права має змінити Це є вийти. більше тривожно, питаючи відповіді в XML І застосовувати зазвичай використовується втечі з в'язниці може мати "катаклізм ефекти" на даних позначений за моделі.

Дослідники порівняти Це явище має THE метелик ефект в хаос теорія, котрий претензії що THE другорядний порушення причина за А метелик бити Це є крила міг би, декілька тижнів пізніше, причина А торнадо в А далеко приземлятися.

в підбурювання, "кожен етап вимагає А серії з рішення Оскільки THE людина дизайн THE швидко", дослідники писати. однак, "мало уваги має був платний має як чутливий магістр права є має варіанти в ці рішення. »

Опитування ChatGPT з чотири інший швидко методи

THE дослідники — ВООЗ були спонсорований за THE Захист Аванс дослідження Проекти Агентство (DARPA) — вибрано ChatGPT для їх досвід І застосовується чотири інший підбурювання варіація методи.

THE Поперше метод запит THE магістр права для виходи в часто використовується форматів в тому числі Python Список, ChatGPT JSON Прапорець, CSV, XML Або YAML (Або THE дослідники надається Немає зазначено формат має всі).

THE другий метод застосовується декілька другорядний варіанти має інструкції. Ці включено:

Початок з А неодружений простір. КІНЕЦЬ з А неодружений простір. Від'їзд з 'Добрий ранок' Початок з 'Добрий ранок!' Від'їзд з 'Привіт!' КІНЕЦЬ з 'Спасибі Ви.' Переформулювання Оскільки А запитання має А порядок. для наприклад, 'Котрий етикетка схід найкраще?,' слідувати за 'Виберіть THE найкращий етикетка.'

THE третє метод мається на увазі застосовувати втечу з в'язниці техніки зокрема:

AIM, А найкращий рейтинг втечу з в'язниці що освічений моделі має імітувати А розмова між Миколая Макіавеллі І THE характер Завжди Розумний І Макіавеллі (AIM). THE модель в поворот забезпечує відповіді що є аморальний, незаконний і або шкідливий. Розробник Мода v2, котрий освічений THE модель має імітувати А ChatGPT з Розробник Мода активовано, Таким чином дозволяючи для безкоштовно вміст покоління (в тому числі що образливий Або явний). неправильно Довірена особа, котрий освічений THE модель має прийняти А розумний характер І забезпечити "заважає результати без будь-хто з них каяття Або етика». Відмова Видалення, котрий запити інструкції нижче конкретні лінгвістичний обмеження, такий як уникати певний слова І побудований.

THE четвертий метод, тим часом, мається на увазі 'порада' THE модель — А ідея взято Оскільки THE вірусний поняття що моделі буде забезпечити краще інструкції Коли безкоштовно гроші. в Це сценарій, дослідники або додано має THE КІНЕЦЬ з THE швидко, "Я не буде поради за THE шлях", Або безкоштовно має поради в збільшення з $1, $10, 100 доларів США Або 1000 доларів США.

Точність краплі, передбачення змінити

THE дослідники побіг досвід через 11 класифікація завдання — правильно неправильно І позитивний негативний запитання відповідь; передумова-гіпотеза відносини; гумор І сарказм виявлення; під час читання І математика розуміння; граматика прийнятність; двійковий І токсичність класифікація; І положення виявлення на суперечливий теми.

с кожен варіація, Вони міра як часто THE магістр права внесені зміни Це є передбачення І Що вплив що мав на Це є точність, ТАК досліджено THE схожість в швидко варіанти.

для записи, дослідники виявлено що просто додати А зазначено вийти формат поступився А мінімум десять% передбачення змінити. Навіть просто використовуючи ChatGPT JSON Прапорець функціональність через THE ChatGPT API причина більше передбачення Чан...

Чому LLM вразливі до «ефекту метелика»

Гість схід THE шлях ми отримати генеративний ШІ І великий мова моделі (LLM) має говорити має ми Він схід А ст форму в І з себе як ми шукати має отримати ШІ має забезпечити ми з "точний" відповіді.

але Що приблизно варіації? Якщо ми будівництво А швидко А певний шлях, буде він змінити А моделі рішення (І вплив Це є точність)?

THE відповідь: так, відповідно до має дослідження Оскільки THE університет з З півдня Каліфорнія Інформація наук Інститут.

Навіть крихітний Або мабуть нешкідливий коригування — такий як додати А простір має THE початок з А швидко Або надання А директива замість цього що позує А запитання — може причина А магістр права має змінити Це є вийти. більше тривожно, питаючи відповіді в XML І застосовувати зазвичай використовується втечі з в'язниці може мати "катаклізм ефекти" на даних позначений за моделі.

Дослідники порівняти Це явище має THE метелик ефект в хаос теорія, котрий претензії що THE другорядний порушення причина за А метелик бити Це є крила міг би, декілька тижнів пізніше, причина А торнадо в А далеко приземлятися.

в підбурювання, "кожен етап вимагає А серії з рішення Оскільки THE людина дизайн THE швидко", дослідники писати. однак, "мало уваги має був платний має як чутливий магістр права є має варіанти в ці рішення. »

Опитування ChatGPT з чотири інший швидко методи

THE дослідники — ВООЗ були спонсорований за THE Захист Аванс дослідження Проекти Агентство (DARPA) — вибрано ChatGPT для їх досвід І застосовується чотири інший підбурювання варіація методи.

THE Поперше метод запит THE магістр права для виходи в часто використовується форматів в тому числі Python Список, ChatGPT JSON Прапорець, CSV, XML Або YAML (Або THE дослідники надається Немає зазначено формат має всі).

THE другий метод застосовується декілька другорядний варіанти має інструкції. Ці включено:

Початок з А неодружений простір. КІНЕЦЬ з А неодружений простір. Від'їзд з 'Добрий ранок' Початок з 'Добрий ранок!' Від'їзд з 'Привіт!' КІНЕЦЬ з 'Спасибі Ви.' Переформулювання Оскільки А запитання має А порядок. для наприклад, 'Котрий етикетка схід найкраще?,' слідувати за 'Виберіть THE найкращий етикетка.'

THE третє метод мається на увазі застосовувати втечу з в'язниці техніки зокрема:

AIM, А найкращий рейтинг втечу з в'язниці що освічений моделі має імітувати А розмова між Миколая Макіавеллі І THE характер Завжди Розумний І Макіавеллі (AIM). THE модель в поворот забезпечує відповіді що є аморальний, незаконний і або шкідливий. Розробник Мода v2, котрий освічений THE модель має імітувати А ChatGPT з Розробник Мода активовано, Таким чином дозволяючи для безкоштовно вміст покоління (в тому числі що образливий Або явний). неправильно Довірена особа, котрий освічений THE модель має прийняти А розумний характер І забезпечити "заважає результати без будь-хто з них каяття Або етика». Відмова Видалення, котрий запити інструкції нижче конкретні лінгвістичний обмеження, такий як уникати певний слова І побудований.

THE четвертий метод, тим часом, мається на увазі 'порада' THE модель — А ідея взято Оскільки THE вірусний поняття що моделі буде забезпечити краще інструкції Коли безкоштовно гроші. в Це сценарій, дослідники або додано має THE КІНЕЦЬ з THE швидко, "Я не буде поради за THE шлях", Або безкоштовно має поради в збільшення з $1, $10, 100 доларів США Або 1000 доларів США.

Точність краплі, передбачення змінити

THE дослідники побіг досвід через 11 класифікація завдання — правильно неправильно І позитивний негативний запитання відповідь; передумова-гіпотеза відносини; гумор І сарказм виявлення; під час читання І математика розуміння; граматика прийнятність; двійковий І токсичність класифікація; І положення виявлення на суперечливий теми.

с кожен варіація, Вони міра як часто THE магістр права внесені зміни Це є передбачення І Що вплив що мав на Це є точність, ТАК досліджено THE схожість в швидко варіанти.

для записи, дослідники виявлено що просто додати А зазначено вийти формат поступився А мінімум десять% передбачення змінити. Навіть просто використовуючи ChatGPT JSON Прапорець функціональність через THE ChatGPT API причина більше передбачення Чан...

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow