在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。
借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智能体验。此次发布标志着腾讯在提升车载 AI 智能化水平方面迈出了重要一步。
在4月22日上海车展开幕前夕的 TIME DAY 腾讯智慧出行技术开放日上,腾讯云重磅推出全新的座舱端侧大模型。该模型基于腾讯混元2B 小参数模型打造,并结合汽车行业专业知识数据进行精细调整和本地知识检索增强(RAG),旨在实现通用及车载知识领域的精准问答。
借助该座舱端侧大模型,车辆能够为用户提供包括驾驶行为建议、车辆操作指导、故障处理以及潜在驾驶安全风险提醒等实时服务,真正实现“边开边提醒”的智能体验。此次发布标志着腾讯在提升车载 AI 智能化水平方面迈出了重要一步。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
字节跳动旗下AI代码编辑器Trae宣布支持OpenAI最新o3模型,为开发者带来更强大的智能编程体验。o3模型凭借卓越的逻辑推理和工具使用能力,显著提升代码生成和调试的准确性。Trae结合o3后具备智能代码生成、上下文感知调试、多工具协同等功能,能根据简单描述生成高质量代码,并精准定位错误。开发者社区反响热烈,认为其大幅提升了编程效率。Trae同时注重用户隐私保护,采用OpenAI审议对齐技术确保安全。此次升级标志着AI辅助编程迈入新阶段,未来有望在全球编程生态中发挥更大作用。
微软研究显示,医疗和蓝领职业最不易被AI取代。分析20万用户对话数据发现,外科助手、按摩治疗师等医疗岗位,以及挖掘机操作员、水处理员等蓝领工作,因需体力劳动和人际互动而具备较强抗AI性。研究强调AI适应性评分不能简单预测职业存亡,技术影响具有复杂性。排名显示,疏浚操作员、桥梁管理员等20个职业AI替代风险最低,这些工作或需专业技能,或依赖实际操作经验。
【AI日报速览】1.美图WHEE推出"视频超清"功能,AI一键修复模糊视频画面;2.Kimi K2高速版发布,输出速度提升至40 Tokens/秒;3.阿里开源Qwen3-Coder-Flash编程模型,支持256K上下文;4.Anthropic企业市场份额达32%,超越OpenAI;5.字节跳动发布Seed扩散语言模型,提升代码生成效率;6.马斯克将为Grok用户推出AI视频生成器和虚拟男友;7.Quora的Poe平台推出开发者API,支持100+多模态模型;8.Black Forest Labs开源FLUX.1-Krea图像模型,优化自然美学;9.Augment发布CLI工具Auggie,提升开发者工作效率;10.清华开源MOSS-TTSD语音模型,支持超长语音生成;11.Claude升级支持PDF/图像/代码文件上传处理。
Poe推出API功能,开发者可通过订阅直接调用平台所有AI模型和机器人,包括图像和视频处理能力。该API兼容OpenAI接口,无需额外学习成本,支持文本生成、创意内容制作等多样化需求。订阅制设计降低了使用门槛,让开发者能快速集成Poe的技术能力,探索AI应用潜力。这一更新标志着Poe从聊天平台向开发者工具的转型。
DeepSeek关联公司公开大语言模型部署专利,创新采用分布式架构:将预填充和解码阶段分别部署在高性能计算和大内存机器上。该方法能均衡负载、减少计算闲置,显著降低延迟并提升吞吐量。专利突显系统扩展性和容错性优化,其MoE语言模型DeepSeek-V3拥有6710亿参数,单token激活370亿参数,将推动AI技术在各行业的应用落地。核心突破在于通过硬件资源合理配置实现高效智能部署。
AI初创公司Creao AI完成两轮融资,总额数千万美元,由Monolith等顶级风投领投。该公司专注开发下一代操作系统Agentic OS(AOS),以AI Agent为核心,通过对话即可生成全栈智能应用。创始人程凯表示,AOS将构建数字生产网络,提升多智能体协作效率。投资方认为AOS将重塑人机交互方式,降低技术门槛。团队来自Meta、苹果等科技巨头,融资将用于产品落地和技术研发。
Claude AI功能升级,新增多格式文件上传能力。最新版本支持PDF、图像、代码等文件类型,实现与AI应用的无缝集成。升级后的系统能进行文档分析、图像识别和代码优化等复杂任务,并优化了用户界面和数据处理流程。该功能依托Claude4、Claude3.7Sonnet等先进AI模型,可精准处理多模态数据。此次更新显著提升了AI与数据的协作效率,为专业和普通用户带来更强大的智能分析能力。
清华大学联合多家机构开源MOSS-TTSD语音对话生成模型,基于Qwen3-1.7B-base训练,支持中英双语超长语音生成。创新采用XY-Tokenizer技术,实现1kbps低比特率下保留语音质量,具备零样本音色克隆和声音事件控制能力。在中文指标上优于MoonCast等开源模型,支持最长960秒语音生成,避免拼接不自然。已开放模型权重、API及在线Demo,适用于播客、有声书等场景,未来将优化多说话人切换和情感表达。
新加坡AI芯片检测创企SixSense完成850万美元A轮融资,总融资达1200万美元。该公司由两位女工程师创立,开发了无需编程的AI平台,可实时预测芯片缺陷、分析故障原因,帮助半导体厂商提升良率。其解决方案已应用于GlobalFoundries等大厂,实现产量提升1-2%、人工检测减少90%的成效。随着全球新建晶圆厂增加,公司正重点拓展美国市场。(140字)
马斯克旗下xAI公司推出Grok AI新功能"Imagine",可生成6秒带声音视频,包括露骨内容,引发深度伪造担忧。该功能是Grok4更新的一部分,但已因生成性别化AI伴侣和反犹太言论引发争议。调查显示84%美国人支持立法禁止非自愿深度伪造色情内容。专家批评该技术可能助长性剥削,而公司仍在推进该功能,计划10月正式发布。