MIT研究团队开发出实例自适应缩放技术,可根据问题复杂度动态调整大型语言模型的计算资源,提升效率并降低能耗。该研究获多家机构支持,相关论文已于11月初发布。
Meta与多所大学合作开发DreamGym框架,通过模拟强化学习环境解决大语言模型训练的高成本与反馈不可靠问题。该框架能动态调整任务难度,帮助模型逐步掌握复杂应用,提升训练效率与可靠性。
粉笔推出AI刷题系统班,单日销量达1.4万单,用户学习效率平均提升29%。系统基于7000万用户数据,提供个性化刷题路径,动态调整难度。AI覆盖题库、直播、面试全流程,智能诊断薄弱点,AI面试点评支持手写识别。
微软推出UserLM-8b模型,作为AI助手“陪练伙伴”,通过模拟真实用户多轮对话评估助手性能。它能生成多样化开场白,动态调整对话策略,突破传统测试局限,更精准预测AI在实际交互中的表现和可靠性。
Doubao-1.5-pro 是一个高性能的稀疏 MoE 大语言模型,专注于推理性能与模型能力的极致平衡。
Openai
-
Input tokens/M
Output tokens/M
Context Length
Bytedance
Tencent
Alibaba
$2
32
$0.3
Google
$8.75
$70
1k
Anthropic
$21
$105
200
Stepfun
Baidu
$3
$9
128
Minimax
Moonshot
$10
$30
131
Chatglm
01-ai
MerantixMomentum
ACIP项目提供的Qwen2.5-7B可压缩版本,支持动态调整压缩率并保持模型性能
ACIP项目提供的Qwen2.5-3B可压缩版本,支持动态调整模型大小并保持性能
ACIP项目提供的可压缩版本Llama-3.1-8B模型,支持动态调整压缩率并保持性能
ACIP项目提供的Llama-2-13b可压缩版本,支持动态调整压缩率
ACIP项目提供的可压缩版本Llama-7B模型,支持动态调整压缩率
LiAutoAD
Ristretto是一款创新的视觉语言模型,采用动态图像令牌部署技术,能根据任务需求灵活调整图像令牌数量,在性能和多功能性上超越前代产品。
AnLan577
该模型针对更具挑战性的任务提出了动态路由机制,通过动态调整专家数量来适应不同难度任务的需求。
fnlp
ElasticBERT是一个高效的多出口BERT模型,支持动态调整计算资源。
Sequential Thinking MCP是一个提供结构化思维过程的MCP服务器,通过分步解决问题、管理假设并与Recall区块链集成来存储思维日志,支持动态调整和反思性思考。
该项目实现了一个基于MCP协议的增强型顺序思维服务器,提供结构化的问题解决框架,支持分阶段思考、进度跟踪和动态调整功能。
一个基于Python实现的顺序思维MCP服务器,通过分步思考流程解决复杂问题,支持思维修订、分支推理和动态调整思考步骤。
一个用于Photoshop的MCP服务工具,通过Python脚本自动化PSD文件编辑任务,支持批量处理、动态调整图层和效果,并简化创意资产版本管理。
一个支持SSE的MCP服务器,提供结构化思维工具,用于动态分解和反思性解决问题。
该项目实现了一个基于AI的工作流编排MCP服务器,通过大型语言模型(LLM)实现智能决策和动态调整,支持复杂任务分解、状态持久化和工作流恢复。
一个实现结构化思维过程的MCP服务器,通过分步思考解决复杂问题,支持动态调整和路径分支。