Assembly AI afirma que su nuevo modelo Universal-1 tiene un 30% menos de alucinaciones que Whisper
Unirse Nosotros dentro Atlanta seguro Abril 10mo Y explorar EL paisaje de seguridad la mano de obra. Nosotros voluntad explorar EL visión, Ventajas, Y usar caso de AI para seguridad equipos. Pedido A invitar aquí.
IA como servicio proveedor Asamblea AI tiene A nuevo discurso Reconocimiento modelo llamado Universal-1. Cualificado seguro Más eso 12.5 millón horas de plurilingüe audio datos, EL negocio dicho Él hacer Bien con síntesis vocal precisión a través Inglés, Español, Francés Y Alemán. Él esta alardeando eso Universal-1 puede reducir alucinaciones por 30% seguro discurso datos Y por 90% seguro ambiente ruido comparado con tiene Abierto AI Susurro Gran-v3 modelo.
Dentro A Blog trabajo, EL negocio describir Universal-1 como "otro hito dentro NUESTRO asignación tiene proporcionar preciso, fiel Y robusto síntesis vocal capacidades para varios Las lenguas, parte NUESTRO clientela Y desarrolladores global construir diverso Discurso AI aplicaciones." El largo de con A mejor comprensión de cuatro importante Las lenguas, EL modelo puede interruptor de códigos, transcripción varios IDIOMAS dentro A soltera audio archivo.
Universal-1 también los apoyos mejorado marca de tiempo estimar, cual Este importante Cuando marcha con audio Y video edición Y conversación analítico. Asamblea AI quejas EL nuevo modelo Este 13 por ciento mejor eso Es predecesor, Conformador-2. Como A resultado, hay mejor vocero diarización, mejorado concatenado permutación mínima palabra error tasa (cpWER) de 14%, Y vocero contar estimar precisión por 71%.
Finalmente, paralelo inferencia tiene ha sido hacer Más eficaz, reducir EL dar media vuelta tratamiento tiempo para largo audio archivos. Universal-1 Este dicho tiene lograr Este Mancha cinco veces más rápido eso Susurro Gran-v3. Asamblea AI comparado con Universal-1 tratamiento velocidad con Susurro 3 grandes seguro NVIDIA Estas allá T4 Maquinaria con 16 GB de VRAM. Con A lote tamaño de 64, EL antiguo ha tomado 21 segundos tiene transcribir 1 hora de audio. Sin embargo, utilizando A mucho más pequeño lote tamaño de 24, EL último ha tomado 107 segundos tiene lograr EL incluso tarea.
V. B. EventoEL AI Impacto Recorrido – Atlanta
Unirse Nosotros dentro Atlanta seguro Abril 10mo Y explorar EL paisaje de seguridad la mano de obra. Nosotros voluntad explorar EL visión, Ventajas, Y usar caso de AI para seguridad equipos. Pedido A invitar aquí.
IA como servicio proveedor Asamblea AI tiene A nuevo discurso Reconocimiento modelo llamado Universal-1. Cualificado seguro Más eso 12.5 millón horas de plurilingüe audio datos, EL negocio dicho Él hacer Bien con síntesis vocal precisión a través Inglés, Español, Francés Y Alemán. Él esta alardeando eso Universal-1 puede reducir alucinaciones por 30% seguro discurso datos Y por 90% seguro ambiente ruido comparado con tiene Abierto AI Susurro Gran-v3 modelo.
Dentro A Blog trabajo, EL negocio describir Universal-1 como "otro hito dentro NUESTRO asignación tiene proporcionar preciso, fiel Y robusto síntesis vocal capacidades para varios Las lenguas, parte NUESTRO clientela Y desarrolladores global construir diverso Discurso AI aplicaciones." El largo de con A mejor comprensión de cuatro importante Las lenguas, EL modelo puede interruptor de códigos, transcripción varios IDIOMAS dentro A soltera audio archivo.
Universal-1 también los apoyos mejorado marca de tiempo estimar, cual Este importante Cuando marcha con audio Y video edición Y conversación analítico. Asamblea AI quejas EL nuevo modelo Este 13 por ciento mejor eso Es predecesor, Conformador-2. Como A resultado, hay mejor vocero diarización, mejorado concatenado permutación mínima palabra error tasa (cpWER) de 14%, Y vocero contar estimar precisión por 71%.
Finalmente, paralelo inferencia tiene ha sido hacer Más eficaz, reducir EL dar media vuelta tratamiento tiempo para largo audio archivos. Universal-1 Este dicho tiene lograr Este Mancha cinco veces más rápido eso Susurro Gran-v3. Asamblea AI comparado con Universal-1 tratamiento velocidad con Susurro 3 grandes seguro NVIDIA Estas allá T4 Maquinaria con 16 GB de VRAM. Con A lote tamaño de 64, EL antiguo ha tomado 21 segundos tiene transcribir 1 hora de audio. Sin embargo, utilizando A mucho más pequeño lote tamaño de 24, EL último ha tomado 107 segundos tiene lograr EL incluso tarea.
V. B. EventoEL AI Impacto Recorrido – Atlanta
What's Your Reaction?