< p > Em 6 de junho, a empresa Mural Thinking Intelligence lançou oficialmente sua mais nova obra - a série de modelos MiniCPM4.0. Esta série é conhecida como "a pequena maravilha mais imaginativa da história", não apenas alcançando um salto no desempenho lateral, mas também estabelecendo um novo padrão de inovação tecnológica. < /p >
< p > A série MiniCPM4.0 inclui dois produtos principais: uma versão leve de 8 bilhões de parâmetros com uma arquitetura inovadora de esparsidade que trouxe uma revolução eficiente; e outra versão leve e ágil de apenas 0,5 bilhão de parâmetros, apelidada de "a menor maravilha de pequeno calibre". Ambos os modelos demonstram excelentes resultados em velocidade, eficiência, desempenho e aplicação prática. < /p >
< p > No quesito de velocidade, o MiniCPM4.0 alcançou uma melhoria de até 220 vezes em cenários limite e cinco vezes em condições normais, graças às inovações de aceleração em níveis sistemáticos. Com a tecnologia avançada de troca dupla de frequências, o modelo pode automaticamente alternar entre mecanismos de atenção esparsa e densa com base no comprimento do texto, garantindo uma rápida e eficiente manipulação de textos longos, ao mesmo tempo que reduz significativamente a necessidade de armazenamento lateral, sendo necessário apenas 1/4 do espaço de cache de modelos similares como Qwen3-8B. < /p >
< p style="text-align:center">< img src="https://upload.chinaz.com/2025/0608/6388497352726253514384248.png" title="Captura de tela do WeChat_20250608095812.png" alt="Captura de tela do WeChat_20250608095812.png" />
< p > Em termos de eficiência, o MiniCPM4.0 apresenta uma inovação eficiente de nível sistêmico de rarificação contextual totalmente aberta pela primeira vez na indústria, alcançando uma aceleração extrema com uma rarificação extremamente alta de 5%, combinando técnicas de inovação autodeveloped para otimização completa de todas as camadas, desde a arquitetura até os dados, garantindo uma implementação eficiente de rarificação de software e hardware de nível sistêmico. < /p >
< p > No aspecto do desempenho, o MiniCPM4.0 continua a seguir a tradição de "pequeno mas poderoso". A versão de 0,5 bilhão de parâmetros atingiu metade dos parâmetros e um desempenho dobrado com apenas 2,7% do custo de treinamento; enquanto a versão esparsa de 8 bilhões de parâmetros superou os modelos Qwen3 e Gemma312B com apenas 22% do custo de treinamento, consolidando sua liderança no campo lateral. < /p >
< p > Em termos de aplicação prática, o MiniCPM4.0 demonstra uma capacidade poderosa. Com o framework de inferência extremamente rápido CPM.cu desenvolvido internamente, combinado com inovações como amostragem especulativa, compressão quantificada de modelos e inovações de quadro de implantação lateral, foi possível enxugar 90% do tamanho do modelo enquanto aumentava a velocidade ao máximo, garantindo uma experiência fluida de inferência lateral desde o início até o fim. < /p >
< p > Atualmente, o modelo já foi adaptado com sucesso para chips principais como Intel, Qualcomm, MTK e Huawei Ascend, além de ter sido implantado em várias estruturas de código aberto, expandindo ainda mais seu potencial de aplicação. < /p >
< p > Conjunto de modelos: < /p >
< p > https://www.modelscope.cn/collections/MiniCPM-4-ec015560e8c84d < /p >
< p > Github: < /p >
< p > https://github.com/openbmb/minicpm < /p >