美团近日启动万亿参数级AI大模型测试,该模型完全基于国产算力集群训练,标志着国产技术应用取得重大突破。目前仅对受邀用户开放,尚未全面普及,展现了美团在AI领域的领先布局。
萤石发布首款智能大模型主机EZVIZ AI Core X,集存储、计算与控制于一体,旨在将强大本地算力引入家庭,革新智能设备协同模式。其硬件配置强劲,采用黑色桶状外观设计。
萤石发布AI Core X智能大模型主机,集高性能主机、NAS和智能家居中控于一体,搭载64Tops算力AI单元,旨在成为家庭数字化大脑。
大语言模型推理效率迎来突破。清华大学与Moonshot AI联合提出“预填充即服务”新架构,通过将推理过程拆分为预填充和解码两个阶段,并优化算力资源分配,有效解决硬件限制问题,显著提升模型服务性能。
AIGC 应用快速构建平台
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
$8
$240
52
Bytedance
$1.2
$3.6
4
chavinlo
斯坦福大学tatsu团队复刻的阿尔帕卡模型,这是一个基于LLaMA-7B进行指令微调的大语言模型。模型在4张A100显卡上训练了6小时,由redmond.ai捐赠算力,未使用LoRA技术,采用原生微调方式。