Pesquisadores da Universidade da Califórnia, Berkeley, recentemente lançaram um modelo de mundo grande de código aberto (LWM), capaz de interpretar 1 milhão de dados de uma só vez, com a capacidade de gerar vídeos e imagens a partir de texto. O modelo resolve o problema de cálculo de atenção em sequências longas através da tecnologia Ring Attention, permitindo o processamento eficiente de informações multimodais. Após passar por duas fases de treinamento: pré-treinamento de modelos de linguagem e pré-treinamento multimodal, alcançou resultados notáveis.
Modelo Mundial Amplo: IA gera vídeos e imagens, interpretando 1 milhão de dados de uma só vez
AIGC开放社区
Este artigo é do AIbase Daily
Bem-vindo à coluna [AI Daily]! Este é o seu guia para explorar o mundo da inteligência artificial todos os dias. Todos os dias apresentamos os destaques da área de IA, com foco nos desenvolvedores, para o ajudar a obter insights sobre as tendências tecnológicas e a compreender as aplicações inovadoras de produtos de IA.





