Liquid AI 公司于2025年7月发布第二代 Liquid Foundation Models(LFM2),采用创新的“liquid”架构,旨在成为市场上最快的设备端基础模型。其高效的训练和推理能力使小模型能媲美云端大型语言模型。LFM2 最初提供350M、700M 和1.2B 参数的密集检查点版本。
印度支付巨头Paytm与美国硬件公司Groq合作,将利用GroqCloud云端服务提升AI模型性能,优化交易处理、风险评估、欺诈检测和消费者互动。GroqCloud基于自主研发的语言处理单元,专注于AI推理,旨在增强Paytm平台的智能化水平。
高通发布两款云端AI推理芯片AI200和AI250,计划2026和2027年商用,标志着从终端芯片向全栈AI基础设施转型。消息推动股价单日飙升超20%,创2019年来最大涨幅。与英伟达全能路线不同,高通聚焦大模型推理市场,主打能效与成本优势。
Airtel与IBM达成战略合作,共同提升Airtel Cloud服务。结合Airtel在电信领域的高可靠性和数据驻留优势,以及IBM在云基础设施与AI推理软件的专业技术,双方将助力监管行业企业高效扩展AI工作负载,确保本地、云端及边缘基础设施的互操作性。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Xai
$1.4
$3.5
2k
-
Anthropic
$7
$35
200
Google
$2.1
$17.5
$21
$105
$0.7
Alibaba
$4
$16
Baidu
128
$6
$24
256
$2
Moonshot
Bytedance