DeepSeek V4虽未正式发布,但最新招聘信息已透露其研发重点。官方正集中招募Agent算法、数据评测及基础设施工程师等核心人才。岗位要求显示,团队不仅关注传统算法能力,更重视应聘者对Claude Code、Cursor等前沿开发工具的熟练度,预示新模型将在智能体与代码能力方面重点进化。
OpenAI收购初创公司Promptfoo,强化AI安全布局。这家成立于2024年的公司专注于AI应用评测与安全,拥有23人团队和35万开发者用户,估值达8600万美元。收购将帮助OpenAI弥补智能体安全方面的不足,应对AI智能体快速发展带来的安全挑战。
具身智能评估迎来突破。李飞飞创立的World Labs与光轮智能合作,共建全球首个高保真、可扩展评测体系,推动领域从“演示驱动”转向“评测驱动”,旨在科学、高效、规模化地评估机器人智能水平。
美团LongCat团队开源了最新AI模型LongCat-Flash-Thinking-2601,该模型在智能体搜索、工具调用及推理等多项核心评测中达到开源模型最高水平。其核心优势在于卓越的工具调用能力,能有效处理依赖工具的复杂任务,显著降低真实场景中对新工具的适应成本。
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Anthropic
$7
$35
200
$21
$105
Alibaba
$4
$16
Baidu
-
32
Xai
$1.4
$10.5
256
Deepseek
$12
128
$54
$163
$8.75
$70
400
$1.75
$14
$1
$15
Tencent
24
Chatglm
$8
$2