Assembly AI afirma que su nuevo modelo Universal-1 tiene un 30% menos de alucinaciones que Whisper

Unirse Nosotros dentro Atlanta seguro Abril 10mo Y explorar EL paisaje de seguridad la mano de obra. Nosotros voluntad explorar EL visión, Ventajas, Y usar caso de AI para seguridad equipos. Pedido A invitar aquí.

IA como servicio proveedor Asamblea AI tiene A nuevo discurso Reconocimiento modelo llamado Universal-1. Cualificado seguro Más eso 12.5 millón horas de plurilingüe audio datos, EL negocio dicho Él hacer Bien con síntesis vocal precisión a través Inglés, Español, Francés Y Alemán. Él esta alardeando eso Universal-1 puede reducir alucinaciones por 30% seguro discurso datos Y por 90% seguro ambiente ruido comparado con tiene Abierto AI Susurro Gran-v3 modelo.

Dentro A Blog trabajo, EL negocio describir Universal-1 como "otro hito dentro NUESTRO asignación tiene proporcionar preciso, fiel Y robusto síntesis vocal capacidades para varios Las lenguas, parte NUESTRO clientela Y desarrolladores global construir diverso Discurso AI aplicaciones." El largo de con A mejor comprensión de cuatro importante Las lenguas, EL modelo puede interruptor de códigos, transcripción varios IDIOMAS dentro A soltera audio archivo.

> A cuadro desde Asamblea AI demostración cómo Es Universal-1 discurso Reconocimiento modelo comparado contra industria colegas dentro generado correcto palabras. Imagen crédito: Asamblea IA
Universal-1 también los apoyos mejorado marca de tiempo estimar, cual Este importante Cuando marcha con audio Y video edición Y conversación analítico. Asamblea AI quejas EL nuevo modelo Este 13 por ciento mejor eso Es predecesor, Conformador-2. Como A resultado, hay mejor vocero diarización, mejorado concatenado permutación mínima palabra error tasa (cpWER) de 14%, Y vocero contar estimar precisión por 71%.

Finalmente, paralelo inferencia tiene ha sido hacer Más eficaz, reducir EL dar media vuelta tratamiento tiempo para largo audio archivos. Universal-1 Este dicho tiene lograr Este Mancha cinco veces más rápido eso Susurro Gran-v3. Asamblea AI comparado con Universal-1 tratamiento velocidad con Susurro 3 grandes seguro NVIDIA Estas allá T4 Maquinaria con 16 GB de VRAM. Con A lote tamaño de 64, EL antiguo ha tomado 21 segundos tiene transcribir 1 hora de audio. Sin embargo, utilizando A mucho más pequeño lote tamaño de 24, EL último ha tomado 107 segundos tiene lograr EL incluso tarea.
V. B. Evento
EL AI Impacto Recorrido – Atlanta

Negocio Apr 4, 2024 0 8 Add to Reading List

Unirse Nosotros dentro Atlanta seguro Abril 10mo Y explorar EL paisaje de seguridad la mano de obra. Nosotros voluntad explorar EL visión, Ventajas, Y usar caso de AI para seguridad equipos. Pedido A invitar aquí.

IA como servicio proveedor Asamblea AI tiene A nuevo discurso Reconocimiento modelo llamado Universal-1. Cualificado seguro Más eso 12.5 millón horas de plurilingüe audio datos, EL negocio dicho Él hacer Bien con síntesis vocal precisión a través Inglés, Español, Francés Y Alemán. Él esta alardeando eso Universal-1 puede reducir alucinaciones por 30% seguro discurso datos Y por 90% seguro ambiente ruido comparado con tiene Abierto AI Susurro Gran-v3 modelo.

Dentro A Blog trabajo, EL negocio describir Universal-1 como "otro hito dentro NUESTRO asignación tiene proporcionar preciso, fiel Y robusto síntesis vocal capacidades para varios Las lenguas, parte NUESTRO clientela Y desarrolladores global construir diverso Discurso AI aplicaciones." El largo de con A mejor comprensión de cuatro importante Las lenguas, EL modelo puede interruptor de códigos, transcripción varios IDIOMAS dentro A soltera audio archivo.

Un gráfico de Assembly AI que muestra cómo se compara su modelo de reconocimiento de voz Universal-1 con sus pares de la industria en palabras correctas generadas. Crédito de la imagen: Assembly AI

Universal-1 también los apoyos mejorado marca de tiempo estimar, cual Este importante Cuando marcha con audio Y video edición Y conversación analítico. Asamblea AI quejas EL nuevo modelo Este 13 por ciento mejor eso Es predecesor, Conformador-2. Como A resultado, hay mejor vocero diarización, mejorado concatenado permutación mínima palabra error tasa (cpWER) de 14%, Y vocero contar estimar precisión por 71%.

Finalmente, paralelo inferencia tiene ha sido hacer Más eficaz, reducir EL dar media vuelta tratamiento tiempo para largo audio archivos. Universal-1 Este dicho tiene lograr Este Mancha cinco veces más rápido eso Susurro Gran-v3. Asamblea AI comparado con Universal-1 tratamiento velocidad con Susurro 3 grandes seguro NVIDIA Estas allá T4 Maquinaria con 16 GB de VRAM. Con A lote tamaño de 64, EL antiguo ha tomado 21 segundos tiene transcribir 1 hora de audio. Sin embargo, utilizando A mucho más pequeño lote tamaño de 24, EL último ha tomado 107 segundos tiene lograr EL incluso tarea.

V. B. Evento

EL AI Impacto Recorrido – Atlanta