MiniMax创始人闫俊杰强调以科学方法推进AGI,不追求改变世界的宏大叙事。公司采用“非天才”团队策略,通过交错思维和全模态技术栈逐步实现通用人工智能,模型已覆盖全球200多个国家和地区。交错思维技术通过在推理链中插入“自反思token”,使模型能实时修正逻辑跳跃,该机制已被多家海外主流厂商采纳。
DeepMind提出"帧链"新概念,推动视频生成模型发展。该概念类似"链式思维",使模型能在时空维度进行推理,赋予视频生成独立思维能力。研究团队提出创新构想,标志着视频AI技术的重要突破。
微软开源140亿参数rStar2-Agent模型,通过智能体强化学习技术实现突破。该模型在数学推理基准测试中超越6710亿参数的DeepSeek-R1,核心创新在于采用智能体交互机制替代传统思维链方法,能自主规划推理、调用Python代码验证并动态调整步骤,有效避免推理错误。
近日,阿里语音AI团队宣布开源全球首个支持链式推理的音频生成模型ThinkSound,该模型通过引入思维链(Chain-of-Thought)技术,突破传统视频转音频技术对画面动态捕捉的局限,实现高保真、强同步的空间音频生成。这一突破标志着AI音频技术从“看图配音”向“结构化理解画面”的跨越式发展。
Openai
$7.7
Input tokens/M
$30.8
Output tokens/M
200
Context Length
Baidu
-
32
$0.63
$3.15
131
$1
$4
64
Google
$140
$280
Tencent
$3
$9
16
Bytedance
$105
$420
Sensetime
$1.5
$4.5
128
noctrex
这是PromptCoT-2.0-SelfPlay-30B-A3B模型的MXFP4_MOE量化版本,专门用于文本生成任务。该模型采用了思维链提示和自博弈训练技术,通过量化优化实现了更高效的推理性能。
Siesher
基于Qwen3-1.7B的LoRA微调版本,通过自适应推理和思维程序技术增强复杂逻辑和数学任务的推理能力,支持链式思维、跳跃思维等推理方式。
zijiechen156
基于DeepSeek-R1-Distill-Llama-8B微调的医疗思维链推理模型,通过QLoRA量化技术和Unsloth优化方案增强医疗推理能力。