Los investigadores recurren a Harry Potter para hacer que la IA olvide el material protegido por derechos de autor

NegocioBeat presente : AI Desencadenado - A exclusivo ejecutivo evento para negocio datos líderes. Red Y aprender con industria colegas. Aprender Más

Como EL debate calor en alto alrededor EL usar de protegido por derechos de autor obras tiene Formar grande lengua modelos (LLM) semejante como Abierto AI chatGPT, el meta Lama 2, antrópico claudio 2, A obvio pregunta Jumpscares : puede estos modelos incluso estar modificado O editado tiene retirar su conciencia de semejante obras, sin totalmente reconversión a ellos O rearquitectura ¿a ellos?

Dentro A nuevo papel publicado seguro EL abrir acceder Y no par examinado sitio arXiv.org, coautores Ronen Eldan de microsoft Investigación Y Marca Russinovich de microsoft Azur para proponer A nuevo camino de hacer Exactamente Este por borradura específico información desde A muestra LLM — a saber, todo conciencia de EL existencia de EL Harry Alfarero libros (incluído personajes Y parcelas) desde el meta abrir fuente Lama 2-7B.

Como EL microsoft investigadores escribir: "Entonces que EL modelo ha tomado seguro 184KB Horas de GPU tiene entrenamiento previo, Nosotros mostrar eso dentro a proposito 1 GPU hora de sintonia FINA, Nosotros Efectivamente borrar EL modelos capacidad tiene generar O recordatorio Harry Relacionado con Potter contenido. »

Este trabajar proporciona A importante escenario hacia adaptable lengua modelos. EL capacidad tiene refinar AI seguro tiempo de acuerdo a tiene cambio organizativo necesidades Este llave tiene A largo plazo, seguro para negocios implementaciones.
Evento
AI Desatado

A exclusivo sólo invitados noche de conocimiento Y redes, diseñado para sénior negocio ejecutivos supervisión datos Batería Y estrategias.
Aprender Más EL la magia fórmula
"Tradicional modelos de [máquina] aprendiendo principalmente Concentrarse seguro agregar O fortalecer conciencia a través básico sintonia FINA pero hacer no proporcionar directo mecanismos tiene 'olvidar' O 'desaprender' conciencia," EL autores escribir.

Cómo hizo ellos superar ¿Este? Ellos desarrollado A en tres partidos técnico tiene aproximado desaprender específico información dentro LLM.

En primer lugar, ellos cualificado A modelo seguro EL objetivo datos (Harry Alfarero libros) tiene Identificar fichas La mayor parte relacionado tiene Él por comparando predicciones tiene A Base modelo.

En segundo, ellos reemplazado unico Harry Alfarero expresiones con genérico homólogos Y generado alternativa predicciones reconciliación A modelo sin eso capacitación.

Tercero, ellos refinado EL Base modelo seguro estos alternativa predicciones, Efectivamente borradura EL original texto desde Es memoria Cuando invitado con EL contexto.

TIENE evaluar, ellos probado EL modelos capacidad tiene generar O conversar Harry Alfarero contenido utilizando 300 automáticamente generado instrucciones, como Bien como por inspeccionar simbólico probabilidades. Como Eldan Y Russinovich Estado, "tiene EL mejor de NUESTRO conciencia, Este Este EL En primer lugar papel tiene aquí A eficaz técnico para desaprender dentro generativo lengua modelos. »

Ellos encontrar eso entonces que EL original modelo podría fácilmente conversar complejo Harry Alfarero trama detalles, Después solamente A hora de sintonia FINA su técnico, "Es posible para EL modelo tiene básicamente 'olvidar' EL complejo cuentos de EL Harry Alfarero serie." Rendimiento seguro estándar referencias como ARCO, boolq Y Winogrande "restos casi inafectado. »
Expelliarmus-ing Expectativas
Como EL autores...

Negocio Oct 8, 2023 0 11 Add to Reading List

Los investigadores recurren a Harry Potter para hacer que la IA olvide el material protegido por derechos de autor

NegocioBeat presente : AI Desencadenado - A exclusivo ejecutivo evento para negocio datos líderes. Red Y aprender con industria colegas. Aprender Más

Como EL debate calor en alto alrededor EL usar de protegido por derechos de autor obras tiene Formar grande lengua modelos (LLM) semejante como Abierto AI chatGPT, el meta Lama 2, antrópico claudio 2, A obvio pregunta Jumpscares : puede estos modelos incluso estar modificado O editado tiene retirar su conciencia de semejante obras, sin totalmente reconversión a ellos O rearquitectura ¿a ellos?

Dentro A nuevo papel publicado seguro EL abrir acceder Y no par examinado sitio arXiv.org, coautores Ronen Eldan de microsoft Investigación Y Marca Russinovich de microsoft Azur para proponer A nuevo camino de hacer Exactamente Este por borradura específico información desde A muestra LLM — a saber, todo conciencia de EL existencia de EL Harry Alfarero libros (incluído personajes Y parcelas) desde el meta abrir fuente Lama 2-7B.

Como EL microsoft investigadores escribir: "Entonces que EL modelo ha tomado seguro 184KB Horas de GPU tiene entrenamiento previo, Nosotros mostrar eso dentro a proposito 1 GPU hora de sintonia FINA, Nosotros Efectivamente borrar EL modelos capacidad tiene generar O recordatorio Harry Relacionado con Potter contenido. »

Este trabajar proporciona A importante escenario hacia adaptable lengua modelos. EL capacidad tiene refinar AI seguro tiempo de acuerdo a tiene cambio organizativo necesidades Este llave tiene A largo plazo, seguro para negocios implementaciones.

Evento

AI Desatado

A exclusivo sólo invitados noche de conocimiento Y redes, diseñado para sénior negocio ejecutivos supervisión datos Batería Y estrategias.

Aprender Más EL la magia fórmula

"Tradicional modelos de [máquina] aprendiendo principalmente Concentrarse seguro agregar O fortalecer conciencia a través básico sintonia FINA pero hacer no proporcionar directo mecanismos tiene 'olvidar' O 'desaprender' conciencia," EL autores escribir.

Cómo hizo ellos superar ¿Este? Ellos desarrollado A en tres partidos técnico tiene aproximado desaprender específico información dentro LLM.

En primer lugar, ellos cualificado A modelo seguro EL objetivo datos (Harry Alfarero libros) tiene Identificar fichas La mayor parte relacionado tiene Él por comparando predicciones tiene A Base modelo.

En segundo, ellos reemplazado unico Harry Alfarero expresiones con genérico homólogos Y generado alternativa predicciones reconciliación A modelo sin eso capacitación.

Tercero, ellos refinado EL Base modelo seguro estos alternativa predicciones, Efectivamente borradura EL original texto desde Es memoria Cuando invitado con EL contexto.

TIENE evaluar, ellos probado EL modelos capacidad tiene generar O conversar Harry Alfarero contenido utilizando 300 automáticamente generado instrucciones, como Bien como por inspeccionar simbólico probabilidades. Como Eldan Y Russinovich Estado, "tiene EL mejor de NUESTRO conciencia, Este Este EL En primer lugar papel tiene aquí A eficaz técnico para desaprender dentro generativo lengua modelos. »

Ellos encontrar eso entonces que EL original modelo podría fácilmente conversar complejo Harry Alfarero trama detalles, Después solamente A hora de sintonia FINA su técnico, "Es posible para EL modelo tiene básicamente 'olvidar' EL complejo cuentos de EL Harry Alfarero serie." Rendimiento seguro estándar referencias como ARCO, boolq Y Winogrande "restos casi inafectado. »

Expelliarmus-ing Expectativas

Como EL autores...