微软AI负责人警告,当前AI竞赛过度关注“对齐”人类价值观,却忽视了更根本的“控制”问题。他强调,若无法有效控制AI系统,即使目标对齐,仍将带来危险。
麦当劳荷兰圣诞广告因使用AI生成内容引发争议,主题“节日最糟时光”与传统价值观冲突,画面质量差、角色怪异,最终被迫撤回。
Anthropic公司推出评估Claude聊天机器人政治立场中立性的新方法,要求其回答避免无证据的政治主张,防止被指偏向保守或自由派。系统通过提示和奖励机制鼓励中立回应,可能包含对传统价值观的尊重内容。
AI初创公司Uare.ai获1030万美元种子融资,从数字遗产服务转型为个人专属AI平台。其目标是让用户训练代表自身知识、价值观和人格的AI智能体,重新定义人类与技术的关系,赋能生者而非纪念逝者。
智能助手帮助发现和完善公司核心价值观
探索大型语言模型的偏好和价值观对齐。
Deepwander是一款AI驱动的自我探索工具,旨在增强自我意识,帮助用户与核心价值观和愿望更加接近。
知道你的价值观!
DevQuasar
这是NVIDIA基于Qwen3架构开发的32B参数奖励模型,专门用于强化学习中的奖励评分和原则对齐,帮助训练更安全、更符合人类价值观的AI系统。
Mungert
Mi:dm 2.0是KT开发的韩国中心AI模型,深入内化了韩国社会独特的价值观和认知框架,提供高效的文本生成服务。
mykor
Mi:dm 2.0 是采用 KT 专有技术开发的'以韩国为中心的 AI'模型,深度内化了韩国社会独特的价值观、认知框架和常识推理。
Mi:dm 2.0 是一款以韩国为中心的 AI 模型,由 KT 运用其专有技术开发。该模型深入内化了韩国社会独特的价值观、认知框架和常识推理,不仅能处理和生成韩语内容,还能体现对韩国社会文化规范和价值观的深刻理解。
Motif-Technologies
Motif 2.6B是一个拥有26亿参数的语言模型,在AMD Instinct™ MI250 GPU上从头开始训练,旨在构建符合人类价值观、有用且可靠的AI。
QCRI
Fanar-1-9B-Instruct 是一款强大的阿拉伯语 - 英语大语言模型,由卡塔尔计算研究机构(QCRI)开发,支持现代标准阿拉伯语及多种阿拉伯方言,并与伊斯兰价值观和阿拉伯文化保持一致。
TheMindExpansionNetwork
CARA是一款基于Mistral-Small-24B-Instruct-2501微调的先进语言模型,专为处理情感和关系场景设计,提供情感辅导、冲突解决和价值观澄清等功能。
unsloth
这是一个用于网络内容审核的AI模型,旨在识别和处理不符合法律法规和社会主义核心价值观的内容,维护健康有序的网络环境。
openGPT-X
Teuken-7B-instruct-research-v0.4是一个经过指令微调的70亿参数多语言大语言模型,支持24种欧盟官方语言,专注于欧洲价值观和多语言任务场景。