Тонка настройка збільшує вразливість і ризики LLM
Резюме: Чудово Мова Моделі (LLM) мати стати дуже популярний І мати знайти використовувати справа в багато області, такий як чат-боти, автоматичне завдання завершення агенти, І багато більше. однак, магістр права є вразливий має інший види з напади, такий як втеча з в'язниці, швидко ін'єкція напади, І конфіденційність витік напади. Фундаментальний магістр права пройти суперечливий І вирівнювання навчання має навчитися ні має генерувати зловмисний І токсичний вміст. для спеціалізовані використовувати випадок, ці фундаментальний магістр права є подано має тонке налаштування Або кількісна оцінка для краще продуктивність І ефективність. ми оглядати THE вплив з за течією завдання такий як тонке налаштування І кількісна оцінка на магістр права вразливість. ми тест основа моделі як Містраль, Лама, MosaicML, І їх вишуканий версії. НАША дослідження дивитися що тонке налаштування І кількісна оцінка зменшений втечу з в'язниці опір значно, провідний має збільшити магістр права уразливості. нарешті, ми продемонструвати THE корисність з зовнішній охоронець в зменшити магістр права вразливості.
![Тонка настройка збільшує вразливість і ризики LLM](https://arxiv.org/static/browse/0.3.4/images/arxiv-logo-fb.png)
Резюме: Чудово Мова Моделі (LLM) мати стати дуже популярний І мати знайти використовувати справа в багато області, такий як чат-боти, автоматичне завдання завершення агенти, І багато більше. однак, магістр права є вразливий має інший види з напади, такий як втеча з в'язниці, швидко ін'єкція напади, І конфіденційність витік напади. Фундаментальний магістр права пройти суперечливий І вирівнювання навчання має навчитися ні має генерувати зловмисний І токсичний вміст. для спеціалізовані використовувати випадок, ці фундаментальний магістр права є подано має тонке налаштування Або кількісна оцінка для краще продуктивність І ефективність. ми оглядати THE вплив з за течією завдання такий як тонке налаштування І кількісна оцінка на магістр права вразливість. ми тест основа моделі як Містраль, Лама, MosaicML, І їх вишуканий версії. НАША дослідження дивитися що тонке налаштування І кількісна оцінка зменшений втечу з в'язниці опір значно, провідний має збільшити магістр права уразливості. нарешті, ми продемонструвати THE корисність з зовнішній охоронець в зменшити магістр права вразливості.
What's Your Reaction?
![like](https://vidianews.com/assets/img/reactions/like.png)
![dislike](https://vidianews.com/assets/img/reactions/dislike.png)
![love](https://vidianews.com/assets/img/reactions/love.png)
![funny](https://vidianews.com/assets/img/reactions/funny.png)
![angry](https://vidianews.com/assets/img/reactions/angry.png)
![sad](https://vidianews.com/assets/img/reactions/sad.png)
![wow](https://vidianews.com/assets/img/reactions/wow.png)