Adobe 为 Firefly 平台引入 OpenAI 的 GPT-Image1.5 模型,并推出限时激励:1月15日前,Pro 和 Premium 订阅用户可无限量使用该模型生成图片。此举显示 Adobe 正从单一模型转向构建多模态 AI 生态。
Jan团队发布300亿参数多模态大模型Jan-v2-VL-Max,专为长周期、高稳定性自动化任务设计,性能超越谷歌Gemini2.5Pro与DeepSeek R1。该模型重点解决多步任务中的“误差累积”和“失焦”问题,为开源智能体生态提供强大支持。
优必选旗下优奇与火山引擎合作,整合机器人本体与云端AI技术,加速大模型在工业物流领域的应用。双方将围绕多模态大模型、VLA模型、世界模型及豆包生态展开合作,推动技术规模化落地。
重庆市发布“人工智能+”行动方案,以“智能原生”为核心,系统培育AI驱动的消费新产品、新服务与新业态,构建覆盖个人、家庭与商业场景的全栈式AI终端生态。方案聚焦六大方向,推动AI与硬件深度融合,包括支持研发具备多模态交互与深度意图理解能力的AI手机、AI计算机等智能终端设备升级。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
-
Anthropic
$105
$525
200
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
$8
$240
52
NyxKrage
Moondream 3 Preview HF是基于HuggingFace Transformers架构规范对Moondream 3 (Preview)模型的重新实现,使其能够与Hugging Face生态系统完全兼容。这是一个多模态视觉语言模型,采用专家混合(MoE)文本主干,约90亿参数,20亿活跃参数。
docling-project
SmolDocling是一款超紧凑的多模态视觉语言模型,专门为高效的文档转换而设计。该模型基于Idefics3架构,在256M参数规模下实现了强大的文档理解能力,支持从图像中提取文本、表格、公式、代码等多种文档元素,并与Docling生态系统完全兼容。
MVRL
TaxaBind 是一个包含六种模态的多模态嵌入空间模型,专注于生态应用,支持利用分类学文本类别对物种图像进行零样本分类。