智谱AI因GLM-4.7上线后用户激增导致算力紧张,宣布对GLM Coding Plan限量发售以保障存量用户体验。高峰期并发限流,显示国产大模型需求旺盛。
微软CEO纳德拉在达沃斯论坛提出,AI的“token”正成为新型全球商品,其能源成本将直接影响各国GDP增长。这意味着AI竞争已上升到国家能源战略与基础设施层面,算力成为由电力驱动的实体资源,决定地区经济潜力。
特斯拉重启Dojo3项目,从自动驾驶转向太空AI计算,标志战略重大调整。该项目曾因团队负责人离职而搁置,现迎来新方向。
全球AI服务器市场迎来爆发期,预计2026年出货量同比增长28.3%,整体服务器市场增速达12.8%。增长动力正从模型训练转向推理应用,推动通用服务器需求显著提升。
一站式大模型微调平台,支持多种主流模型。
提供稳定高效的 AI 算力及 GPU 租赁服务。
智能算力即开即用,全面提升效率与竞争力。
专注于 GPU 算力云服务,提供高效算力解决方案。
Anthropic
$21
Input tokens/M
$105
Output tokens/M
200
Context Length
Alibaba
$2
-
256
Bytedance
Iflytek
$0.3
32
Openai
$17.5
$70
128
Stepfun
$1
Bigcode
8
01-ai
$0.99
Google
Chatglm
Baichuan
4
chavinlo
斯坦福大学tatsu团队复刻的阿尔帕卡模型,这是一个基于LLaMA-7B进行指令微调的大语言模型。模型在4张A100显卡上训练了6小时,由redmond.ai捐赠算力,未使用LoRA技术,采用原生微调方式。
google
ELECTRA是一种通过判别式预训练而非生成式预训练的高效文本编码器,能以较低算力取得优异性能