Hace poco, la empresa líder en el campo de la inteligencia artificial multimodal, Shengshu Technology, anunció con éxito una financiación de cientos de millones de yuanes en su ronda A. Esta financiación fue liderada por Boc Capital, y los inversores anteriores como Baidu Ventures, el Fondo de Inversión en la Industria de Inteligencia Artificial de Beijing y otros continuaron apoyando, lo que muestra un alto reconocimiento del mercado hacia Shengshu Technology. La empresa planea utilizar estos fondos para impulsar aún más el desarrollo de modelos y la innovación tecnológica, explorar el potencial de los grandes modelos multimodales y acelerar así la expansión de sus productos y servicios a usuarios.

La tecnología multimodal, especialmente en el campo de la generación de videos, está en una fase de rápido desarrollo. El responsable de financiación de Shengshu Technology dijo que se espera que, en los próximos tres años, la generación multimodal cambie la forma en que se produce el contenido digital a nivel mundial y vaya penetrando gradualmente en todas las industrias. En este contexto, el modelo de video Vidu lanzado por Shengshu Technology en 2023 ha tenido un buen desempeño, logrando ingresos recurrentes anuales superiores a 20 millones de dólares en apenas 8 meses, y generando más de 400 millones de videos en todo el mundo.

El éxito de Vidu no solo se refleja en los ingresos, sino también en la amplia aplicación comercial. Shengshu Technology ha establecido colaboraciones con empresas conocidas como JD.com y Amazon, abarcando escenarios industriales como publicidad, comercio electrónico, promoción cinematográfica y producción de animación. Estas colaboraciones no solo validan la capacidad técnica de Shengshu Technology, sino que también marcan un mayor avance en la madurez de la aplicación comercial de la generación de videos.

A medida que la tecnología avanza, la generación de videos está siendo ampliamente considerada como el área más desafiante dentro del ámbito multimodal. El responsable de financiación de Shengshu Technology cree que en los próximos años, la capacidad de generación de videos seguirá mejorando, desarrollándose hacia una mayor controlabilidad, coherencia y contexto prolongado. Además, la implementación de funciones de generación y edición en tiempo real hará que la generación de videos sea más flexible y eficiente.

En cuanto al entorno general de la industria, con la caída de los precios de las GPU y el avance de la capacidad computacional nacional, los costos de generación de videos podrían disminuir significativamente, acelerando así la penetración comercial empresarial. Sin embargo, mientras la industria se desarrolla rápidamente, también enfrentará desafíos como la gestión de derechos de autor y la regulación de información falsa; las empresas necesitan prepararse anticipadamente en aspectos como la conformidad y la identificación de contenido.