Modelos especializados: cómo la IA sigue el camino de la evolución del hardware

Unirse líderes dentro san Francisco seguro Enero diez para A exclusivo noche de redes, conocimiento, Y conversación. Pedido A invitar aquí.

EL industria cambiar hacia despliegue más pequeño, Más especializado — Y Entonces Más eficaz — AI modelos espejos A transformación nosotros tenemos previamente presenciado dentro EL material mundo. A saber, EL adopción de cuadro tratamiento unidades (GPU), tensor tratamiento unidades (TPU) Y otro material aceleradores como medio tiene Más eficaz informática.

Hay A sencillo explicación para los dos caso, Y Él venir hacia abajo tiene física.
EL UPC permuta
Procesadores eran construido como general informática motores diseñado tiene ejecutar arbitrario tratamiento Tareas — Nada desde clasificación datos, tiene hacer cálculos, tiene controlar externo dispositivos. Ellos manejar A ancho rango de memoria acceder patrones, calcular las operaciones, Y control fluir.

Sin embargo, Este generalidad venir tiene A costo. Como UPC material Componentes apoyo A ancho rango de Tareas Y Las decisiones a proposito Qué EL procesador debería estar hacer tiene no importa cual dado tiempo — cual peticiones Más silicio para circuitos, energía tiene poder Él Y de clase, tiempo tiene ejecutar aquellos operaciones.
V.B. Evento
EL AI Impacto Visita

Obtener tiene A AI Gobernancia Plan – Pedido A invitar para EL Ene diez evento.
Aprender Más
Este permuta, entonces que oferta Versatilidad, intrínsecamente reducido eficiencia.

Este directamente explicar Por qué especializado informática tiene cada vez más volverse EL estándar dentro EL aprobar 10-15 años.
GPU, TPU, Unidad Nuclear Nuclear, Oh Mi
Hoy Tú no puede haber A conversación a proposito AI sin vidente mencionado de GPU, TPU, Unidad Nuclear Nuclear Y diverso formas de AI material motores.

Estos especializado motores están, esperar para Él, menos generalizado — significado ellos hacer menos Tareas eso A UPC, pero porque ellos están menos general ellos están mucho Más eficaz. Ellos dedicar Más de su transistor Y energía tiene hacer real informática Y datos acceder dedicado tiene EL Mancha tiene mano, con menos apoyo dedicado tiene general Tareas (Y EL diverso Las decisiones pareja con Qué tiene cálculo/acceso tiene no importa cual dado tiempo).

Porque ellos están mucho más simple Y económico, A sistema puede permitir tiene haber A trama Más de aquellos calcular motores marcha dentro paralelo Y De este modo llevar a cabo Más operaciones por unidad de tiempo Y unidad de energía.
EL paralelo cambiar dentro grande lengua modelos
A paralelo evolución Este despliegue dentro EL Reino de grande lengua modelos (LLM).

Como procesadores, general modelos semejante como GPT-4 están impresionante porque de su generalidad Y capacidad tiene llevar a cabo sorprendente complejo Tareas. Pero eso generalidad también invariablemente venir desde A costo dentro número de configuraciones (rumores haber Él Este dentro EL orden de Miles de millones de configuraciones a través EL juntos de modelos) Y EL pareja calcular Y memoria acceder costo tiene evaluar todo EL operaciones necesario para inferencia.

Este tiene dado aumentar tiene especializado modelos como CódigoLlama eso puede llevar a cabo codificación Tareas con bien precisión (potencialmente incluso mejor precisión) pero tiene A mucho más bajo costo. Otro ejemplo, Lama-2-7B puede llevar a cabo típico lengua manejo Tareas como entidad extracción Bien Y también tiene A mucho más bajo costo. Mistral...

Negocio Jan 7, 2024 0 9 Add to Reading List

Modelos especializados: cómo la IA sigue el camino de la evolución del hardware

Unirse líderes dentro san Francisco seguro Enero diez para A exclusivo noche de redes, conocimiento, Y conversación. Pedido A invitar aquí.

EL industria cambiar hacia despliegue más pequeño, Más especializado — Y Entonces Más eficaz — AI modelos espejos A transformación nosotros tenemos previamente presenciado dentro EL material mundo. A saber, EL adopción de cuadro tratamiento unidades (GPU), tensor tratamiento unidades (TPU) Y otro material aceleradores como medio tiene Más eficaz informática.

Hay A sencillo explicación para los dos caso, Y Él venir hacia abajo tiene física.

EL UPC permuta

Procesadores eran construido como general informática motores diseñado tiene ejecutar arbitrario tratamiento Tareas — Nada desde clasificación datos, tiene hacer cálculos, tiene controlar externo dispositivos. Ellos manejar A ancho rango de memoria acceder patrones, calcular las operaciones, Y control fluir.

Sin embargo, Este generalidad venir tiene A costo. Como UPC material Componentes apoyo A ancho rango de Tareas Y Las decisiones a proposito Qué EL procesador debería estar hacer tiene no importa cual dado tiempo — cual peticiones Más silicio para circuitos, energía tiene poder Él Y de clase, tiempo tiene ejecutar aquellos operaciones.

V.B. Evento

EL AI Impacto Visita

Obtener tiene A AI Gobernancia Plan – Pedido A invitar para EL Ene diez evento.

Aprender Más

Este permuta, entonces que oferta Versatilidad, intrínsecamente reducido eficiencia.

Este directamente explicar Por qué especializado informática tiene cada vez más volverse EL estándar dentro EL aprobar 10-15 años.

GPU, TPU, Unidad Nuclear Nuclear, Oh Mi

Hoy Tú no puede haber A conversación a proposito AI sin vidente mencionado de GPU, TPU, Unidad Nuclear Nuclear Y diverso formas de AI material motores.

Estos especializado motores están, esperar para Él, menos generalizado — significado ellos hacer menos Tareas eso A UPC, pero porque ellos están menos general ellos están mucho Más eficaz. Ellos dedicar Más de su transistor Y energía tiene hacer real informática Y datos acceder dedicado tiene EL Mancha tiene mano, con menos apoyo dedicado tiene general Tareas (Y EL diverso Las decisiones pareja con Qué tiene cálculo/acceso tiene no importa cual dado tiempo).

Porque ellos están mucho más simple Y económico, A sistema puede permitir tiene haber A trama Más de aquellos calcular motores marcha dentro paralelo Y De este modo llevar a cabo Más operaciones por unidad de tiempo Y unidad de energía.

EL paralelo cambiar dentro grande lengua modelos

A paralelo evolución Este despliegue dentro EL Reino de grande lengua modelos (LLM).

Como procesadores, general modelos semejante como GPT-4 están impresionante porque de su generalidad Y capacidad tiene llevar a cabo sorprendente complejo Tareas. Pero eso generalidad también invariablemente venir desde A costo dentro número de configuraciones (rumores haber Él Este dentro EL orden de Miles de millones de configuraciones a través EL juntos de modelos) Y EL pareja calcular Y memoria acceder costo tiene evaluar todo EL operaciones necesario para inferencia.

Este tiene dado aumentar tiene especializado modelos como CódigoLlama eso puede llevar a cabo codificación Tareas con bien precisión (potencialmente incluso mejor precisión) pero tiene A mucho más bajo costo. Otro ejemplo, Lama-2-7B puede llevar a cabo típico lengua manejo Tareas como entidad extracción Bien Y también tiene A mucho más bajo costo. Mistral...