Google DeepMind innova con “Mirasol3B” para análisis de vídeo avanzado

Están Tú listo tiene traer Más conciencia tiene su ¿marca? Considerar volverse A patrocinador para EL AI Impacto Recorrido. Aprender Más a proposito EL oportunidades aquí.

Google mente profunda tranquilamente reveló A significativo avance dentro su artificial inteligencia (AI) investigación seguro Martes, presentación A nuevo autorregresivo modelo puntería tiene mejora EL comprensión de largo video entradas.

EL nuevo modelo, fijado “Mirasol3B” demuestra A revolucionario acercarse tiene multimodal aprendiendo, tratamiento audio, video, Y texto datos dentro A Más integrado Y eficaz camino.

De acuerdo a tiene isaac Noble, A software ingeniero tiene Google Investigación, Y anelia Ángelova, A investigación científico tiene Google Espíritu profundo, OMS coescrito A largo Blog trabajo a proposito su investigación, EL desafío de Edificio multimodal modelos mentiras dentro EL heterogeneidad de EL modalidades.

"Algunas de EL Términos y condiciones podría estar Bien sincronizado dentro tiempo (por ejemplo., audio, video) pero no alineado con texto," ellos explicar. "Además, EL grande volumen de datos dentro video Y audio señales Este mucho más grande eso eso dentro texto, Entonces Cuando combinatorio a ellos dentro multimodal modelos, video Y audio frecuentemente no puede estar completamente consume Y necesidad tiene estar desproporcionado comprimido. Este problema Este exacerbado para mas largo video entradas. »

V.B. Evento

EL AI Impacto Visita

Conectar con EL negocio AI comunidad tiene VentureBeat AI Impacto Recorrido futuro tiene A ciudad cerca ¡tú!

Aprender Más A nuevo acercarse tiene multimodal aprendiendo

Dentro respuesta tiene Este complejidad, el de google Mirasol3B modelo desacopla multimodal modelado dentro apartado concentrarse autorregresivo modelos, tratamiento contribuciones de acuerdo a tiene EL características de EL modalidades.

"NUESTRO modelo consiste de A autorregresivo componente para EL sincronizado en el tiempo Términos y condiciones (el audio Y video) Y A apartado autorregresivo componente para Términos y condiciones eso están no necesariamente alineado en el tiempo pero están siempre secuencial, por ejemplo., texto contribuciones, semejante como A título O descripción," noble Y angelova explica.

EL anuncio venir tiene A tiempo Cuando EL tecnología industria Este esforzarse tiene aprovechar EL poder de AI tiene analizar Y comprender vasto las cantidades de datos a través diferente formatos. el de google Mirasol3B representado A significativo escenario Antes dentro Este esfuerzo, apertura en alto nuevo posibilidades para aplicaciones semejante como video pregunta respuesta Y largo video calidad seguro.

Google DeepMind innova con “Mirasol3B” para análisis de vídeo avanzado

Están Tú listo tiene traer Más conciencia tiene su ¿marca? Considerar volverse A patrocinador para EL AI Impacto Recorrido. Aprender Más a proposito EL oportunidades aquí.

Google mente profunda tranquilamente reveló A significativo avance dentro su artificial inteligencia (AI) investigación seguro Martes, presentación A nuevo autorregresivo modelo puntería tiene mejora EL comprensión de largo video entradas.

EL nuevo modelo, fijado “Mirasol3B” demuestra A revolucionario acercarse tiene multimodal aprendiendo, tratamiento audio, video, Y texto datos dentro A Más integrado Y eficaz camino.

De acuerdo a tiene isaac Noble, A software ingeniero tiene Google Investigación, Y anelia Ángelova, A investigación científico tiene Google Espíritu profundo, OMS coescrito A largo Blog trabajo a proposito su investigación, EL desafío de Edificio multimodal modelos mentiras dentro EL heterogeneidad de EL modalidades.

"Algunas de EL Términos y condiciones podría estar Bien sincronizado dentro tiempo (por ejemplo., audio, video) pero no alineado con texto," ellos explicar. "Además, EL grande volumen de datos dentro video Y audio señales Este mucho más grande eso eso dentro texto, Entonces Cuando combinatorio a ellos dentro multimodal modelos, video Y audio frecuentemente no puede estar completamente consume Y necesidad tiene estar desproporcionado comprimido. Este problema Este exacerbado para mas largo video entradas. »

V.B. Evento

EL AI Impacto Visita

Conectar con EL negocio AI comunidad tiene VentureBeat AI Impacto Recorrido futuro tiene A ciudad cerca ¡tú!

Aprender Más A nuevo acercarse tiene multimodal aprendiendo

Dentro respuesta tiene Este complejidad, el de google Mirasol3B modelo desacopla multimodal modelado dentro apartado concentrarse autorregresivo modelos, tratamiento contribuciones de acuerdo a tiene EL características de EL modalidades.

"NUESTRO modelo consiste de A autorregresivo componente para EL sincronizado en el tiempo Términos y condiciones (el audio Y video) Y A apartado autorregresivo componente para Términos y condiciones eso están no necesariamente alineado en el tiempo pero están siempre secuencial, por ejemplo., texto contribuciones, semejante como A título O descripción," noble Y angelova explica.

EL anuncio venir tiene A tiempo Cuando EL tecnología industria Este esforzarse tiene aprovechar EL poder de AI tiene analizar Y comprender vasto las cantidades de datos a través diferente formatos. el de google Mirasol3B representado A significativo escenario Antes dentro Este esfuerzo, apertura en alto nuevo posibilidades para aplicaciones semejante como video pregunta respuesta Y largo video calidad seguro.

What's Your Reaction?

like

dislike

love

funny

angry

sad

wow