科大讯飞星火大模型平台通过国家安全标准试点验证,获首批《人工智能安全国家标准符合性自评估证书》。认证依据我国首个生成式AI专项安全技术标准GB/T45654-2025,涵盖训练数据安全等要求,标志着讯飞在AI安全领域取得重要进展。
艾伦人工智能研究所发布开源视频语言模型Molmo2系列,包括基于阿里巴巴Qwen3的4B和8B版本,以及基于Ai2Olmo的完全开源7B版本,并公开训练数据,彰显其开源承诺。
知识共享组织(CC)对“付费爬取”技术表示谨慎支持,该系统允许AI爬虫访问网站时自动支付报酬。CC此前已推出“开放人工智能生态系统”框架,旨在为数据控制方和AI训练方提供共享数据集的法律技术支持。
埃隆・马斯克在巴伦投资大会上首次量化预测AGI时间表:明年Q1发布的Grok 5有约10%概率实现通用人工智能。技术亮点包括:6万亿参数MoE架构(稀疏度70%)、多模态统一编码(文本/图像/音频/实时视频流)、帧级延迟<120ms。训练数据来自X平台每日5亿帖文与2亿小时视频流,支持实时回灌训练。
Openai
-
Input tokens/M
Output tokens/M
Context Length
Anthropic
$21
$105
200
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
$8.75
$70
400
$1.75
$14
$0.35
$525
Huawei
128
Tencent
28
$7.7
$30.8
4
$3.5
$10.5
16
$2
Minimax
DragonLLM
LLM Pro Finance是一款专为金融和经济专业人士设计的多语言人工智能模型,基于大量高质量的金融和经济数据训练,能够针对复杂的金融问题生成准确且贴合上下文的回应。
Tesslate
WEBGEN DEVSTRAL IMAGES 是一个专注于网页生成的人工智能模型,能够利用 HTML、CSS、JS 和 Tailwind 技术生成单页式网页。该项目基于自定义模板进行训练,采用监督微调方法,使用 GPT-OSS-120B 生成的数据集进行训练。
stanfordmimi
MedVAL-4B是一个经过微调的语言模型,能够以接近医生级别的可靠性评估人工智能生成的医学文本输出。它是一个自监督框架,利用合成数据训练评估器大语言模型,无需医生标签或参考输出即可评估大语言模型生成的医学输出与输入之间的事实一致性。
allenai
OLMo 2 1B是艾伦人工智能研究所推出的开放语言模型系列中最小的模型,基于OLMo-mix-1124预训练,并在中期训练阶段使用Dolmino-mix-1124数据集。
humain-ai
ALLaM-7B-Instruct-preview是由沙特数据与人工智能管理局(SDAIA)开发的双语阿拉伯语-英语大语言模型。该模型经过5.2万亿标记的预训练,专门针对阿拉伯语优化,同时保留英语能力,支持指令跟随和对话任务。
ALLaM-AI
ALLaM是由沙特数据与人工智能管理局(SDAIA)开发的阿拉伯语言技术大语言模型,支持阿拉伯语和英语,采用完全从头训练模式,具有70亿参数。
internlm
InternLM-20B是由上海人工智能实验室联合商汤科技、香港中文大学和复旦大学发布的200亿参数预训练模型,在超过2.3T高质量中英文及代码token数据上进行预训练,具备卓越的综合性能和强大的工具调用能力。