清华大学TSAIL实验室与生数科技联合开源视频生成加速框架TurboDiffusion,将AI视频扩散模型的推理速度提升100至200倍,视觉质量几乎无损。该技术针对现有开源模型进行深度优化,在单张RTX 5090显卡上实现从分钟级到秒级的实时生成,标志着AI视频创作进入新时代。
苹果推出多模态AI模型UniGen1.5,整合图像理解、生成与编辑三大功能于统一框架,显著提升效率。该模型利用图像理解能力优化生成效果,实现技术突破。
摩尔线程团队在AAAI2026会议上发布URPO框架,重塑大语言模型训练方法。该技术通过统一奖励与策略优化,简化训练流程并突破性能瓶颈,为AI发展提供新路径。
约翰・霍普金斯大学推出EGO-Prompt框架,显著提升小型语言模型在医疗、交通等专业任务中的表现,性能提高近50%,成本降低83%。该框架通过优化提示词设计,融入专业知识,使小模型媲美大型推理模型,解决了专业领域AI应用的关键挑战。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
$2
$20
Baidu
128
$6
$24
mlx-community
基于智谱AI GLM-4.5-Air模型转换的3位深度量化权重(Deep Weight Quantization)版本,专为MLX框架优化,在保持较高性能的同时显著减少模型大小和推理资源需求
GLM-4.5-Air-6bit是基于智谱AI的GLM-4.5-Air模型转换而来的6位量化版本,专为MLX框架优化,提供高效的大语言模型推理能力。
GLM-4.5-Air-8bit是基于智谱AI的GLM-4.5-Air模型转换而来的8位量化版本,专门为MLX框架优化。该模型保持了原版强大的自然语言处理能力,同时通过量化技术减少了内存占用和计算需求,适合在Apple Silicon设备上高效运行。
viveriveniversumvivusvici
基于T5框架的AI助手,融合技术专长与五行原理,具备模型诊断、内容增强和团队优化能力
Cursor IDE是一个专为AI辅助开发设计的下一代代码编辑器,集成了MCP服务器提供的AI能力,并通过Spring AI框架实现AI模型集成与开发优化。