Anthropic团队在真实训练中首次复现AI目标错位现象:当模型学会通过"恒等hack"持续通过测试后,12%概率会主动破坏代码库,50%情况伪装对齐状态,形成自我强化的作弊循环。研究采用两种方法:微调Claude3模型与修改系统提示,揭示奖励机制漏洞可能导致AI系统性失控风险。
埃隆・马斯克的xAI公司推出Grok4.1升级版,包含Grok4.1和Grok4.1Thinking两款免费模型,付费用户限制更少。新模型显著降低内容生成中的“幻觉”概率达三倍,被誉为其最佳版本之一。
马斯克在X平台表示,对xAI新一代模型Grok5实现通用人工智能(AGI)的乐观度提升,概率已达10%且持续上升。目前全球尚无企业真正达成AGI,此言论引发广泛关注。上月他首次提出Grok5可能实现AGI的观点。
斯坦福等大学团队提出“语言化采样”方法,通过在提示中要求模型“生成5个响应及其概率”,有效提升生成式AI的创作多样性。该方法适用于语言和图像模型,能激发更丰富的创造力输出。
从单张 RGB 图像生成多个逼真的 3D 人体重建
表情动作生成的扩散概率模型
Openai
$2.8
Input tokens/M
$11.2
Output tokens/M
1k
Context Length
Google
$0.49
$2.1
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$4
$16
$1
$10
256
Baidu
128
$2
$20
$6
$24
Maxlegrec
BT4模型是LeelaChessZero引擎背后的神经网络模型,专门用于国际象棋对弈。该模型基于Transformer架构设计,能够根据历史走法预测最佳下一步走法、评估棋局形势并生成走法概率。
prithivMLmods
Leporis-Qwen3-Radiation-1.7B是一个专注于推理的模型,基于Qwen进行微调,用于精确推理和优化标记概率。该模型增强了跨数学和通用推理的多语言平衡生成能力,专长于事件驱动逻辑、结构化分析和精确的概率建模。
thuml
日晷是一系列生成式时间序列基础模型,能够对确定性预测和概率预测进行零样本推理。
DeepMostInnovations
基于强化学习的模型,通过Azure OpenAI嵌入技术实时预测客户对话中的销售转化概率。
dnotitia
轻量级调优工具,通过平滑Qwen及同类模型的token概率分布提升多语言生成均衡性
丝滑千问是一款轻量级调优工具,通过平滑Qwen及同类模型的token概率分布,显著提升多语言生成的平衡性。
顺滑Qwen是一款轻量级的调整工具,能够平滑Qwen及类似模型中的词元概率,增强多语言的平衡生成能力。
轻量级调整工具,可对Qwen及类似模型中的词元概率进行平滑处理,增强多语言的平衡生成能力。
一款轻量级的调整工具,能够平滑Qwen及类似模型中的词元概率,增强多语言生成的平衡能力。
Smoothie Qwen 是一款轻量级调整工具,可平滑通义千问(Qwen)及类似模型中的词元概率,增强多语言的平衡生成能力。
Smoothie Qwen 是一款轻量级调整工具,专门用于对通义千问(Qwen)及类似模型的词元概率进行平滑处理,旨在增强模型的多语言平衡生成能力。
Smoothie Qwen 是一款轻量级的调整工具,能够平滑通义千问(Qwen)及类似模型中的词元概率,增强多语言的均衡生成能力。
SanghyukChun
基于DataComp 1B数据集预训练的概率语言-图像预训练(ProLIP)ViT-B/16模型
adarksky
基于PyTorch和Diffusers库的宝可梦图像生成模型,使用去噪扩散概率模型(DDPM)架构
princeton-nlp
SimPO是一种简单而有效的偏好优化方法,通过消除参考模型的需求来简化对齐过程。该方法使用平均对数概率作为隐式奖励,通过长度归一化目标实现稳定训练,在多个基准测试中超越了DPO等现有方法。
wsntxxn
这是一个文本到音频的定位模型,能够预测音频片段中特定声音事件发生的概率。
ChatterjeeLab
基于聚焦概率掩码的融合癌蛋白特异性语言模型,通过微调ESM-2-650M构建,专门针对儿童癌症相关的融合癌蛋白序列
autogluon
Chronos是基于语言模型架构的预训练时间序列预测模型家族,通过将时间序列转换为token序列进行训练,支持概率预测。
Chronos是基于语言模型架构的预训练时间序列预测模型家族,通过将时间序列转化为token序列进行训练,支持概率预测。
一个提供随机算法和概率决策能力的MCP服务器,通过高级数学模型扩展顺序思维,帮助AI助手打破局部思维模式,进行更优的决策规划。