阿里千问APP接入万相2.5模型,视频创作能力升级,动作精度和肢体协调性提升,成为首个支持音视频同步输出的移动端AI助手。该模型具备音画同步能力,支持多模态输入输出,在LMArena评测中图生视频能力全球第三。
AI基准平台Epoch AI短暂出现代号“Claude Kayak”的新模型条目,标注今日发布后迅速删除,引发全球关注。业内普遍认为这是Anthropic即将推出的旗舰模型Claude Opus4.5。作为Claude4系列最强版本,预计在复杂推理、多步任务及代码生成能力上实现大幅提升,有望在SWE-bench等评测中突破80%得分,直接对标OpenAI GPT-5.1与Google Gemini3。
谷歌Veo-3模型能生成逼真手术视频,但医学操作理解不足。测试中,AI根据手术图像预测8秒进展,使用SurgVeo标准评估50段真实手术视频。四位外科医生参与评测,发现模型在关键医学步骤上存在缺陷。
快手StreamLake推出AI编程产品矩阵,包含CodeFlicker工具、KAT-Coder系列模型及快手万擎平台,构建智能开发生态。KAT-Coder模型性能卓越,旗舰版KAT-Coder-Pro V1在权威评测中表现突出,推动AI编程高效普惠发展。
领先的AI评测基准,衡量和比较AI模型性能。
AI驱动的亚马逊产品评测和使用手册
基于Christopher Frost镜头评测的AI生成评分和摘要
Xai
$1.4
Input tokens/M
$3.5
Output tokens/M
2k
Context Length
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
-
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64