最近,华为通过其新推出的 “昇腾 + Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。在其技术报告中,华为详尽披露了在 CloudMatrix384超节点上进行的多项技术创新,包括改进的通信机
在中国人工智能领域的不断演进中,李开复创办的 AI 公司 “零一万物” 于2025年3月17日宣布推出其全新的万智企业大模型一站式平台。该平台旨在为企业提供定制化的 DeepSeek 部署解决方案,助力企业高效应用大模型技术。万智企业大模型一站式平台预装了多款高性能 GPU,如昇腾等,内置 DeepSeek 全系列模型,灵活支持前沿的 AI 模型架构,满足企业在搜索和数据处理上的需求。李开复指出,该平台的 AI 搜索产品准确性高达88%,有效减少了大模型的幻觉问题,显著提升了信息检索的准确性和
["2023年,国产大模型崛起,面临算力困境,以“外部制裁,内部发展”为基调。","禁令推动国产GPU芯片崭露头角,华为昇腾、寒武纪思元等成为焦点。","算力问题仍然严峻,公有云厂商通过“集中算力,以云代卡”解决算力需求。","数据成为大模型优劣关键,高质量语言数据可能耗尽,中文数据集稀缺。","未来企业或需投入寻找优质数据,知乎、豆瓣等或迎来发展机遇。"]
Tencent
-
Input tokens/M
Output tokens/M
Context Length
Stepfun
$100