AI大模型竞争白热化:Transformer引领变革

远川科技评论
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,德国科技巨头博世与阿里云达成合作,双方共同推动通义大模型在智能座舱领域的应用。这一创新方案不仅提升了汽车内部环境的智能感知能力,还实现了与 3D 数字人的交互,给用户带来了前所未有的体验。在现代汽车的智能座舱中,乘客和驾驶员可以通过语音和视觉与车辆进行更自然的沟通。博世和阿里云的合作,利用了通义大模型这一强大的 AI 技术,能够实时感知座舱环境,自动调整车内氛围。这意味着,无论是温度、音乐还是灯光,系统都能根据用户的需求智能调整,确保
在刚刚闭幕的第七届 “北京智源大会” 上,智源研究院重磅推出了一系列名为 “悟界” 的大模型。这些模型的发布标志着人工智能领域又一次技术的飞跃,吸引了众多科技爱好者的目光。此次发布的模型包括原生多模态世界模型 Emu3、脑科学多模态通用基础模型见微 Brainμ、以及跨本体的具身大小脑协作框架 RoboOS2.0和具身大脑 RoboBrain2.0。此外,还有全原子微观生命模型 OpenComplex2。这些模型涵盖了从基础科学到复杂智能系统的广泛应用,展现了智源研究院在多模态智能技术方面的雄心和
在今日举行的 2025 北京智源大会上,北京智源人工智能研究院正式发布“悟界”系列大模型,全面展示其在物理通用人工智能(AGI)方向的最新研究成果与战略布局。“悟界”系列意在突破虚实边界、赋能物理世界,涵盖四款前沿模型:多模态世界模型Emu3、脑科学模型见微Brainμ、具身智能大脑RoboBrain 2. 0 以及微观生命模型OpenComplex2,构建了从世界理解、神经建模到具身控制和生命模拟的全链条AI体系。其中,Emu3为原生多模态生成模型,以自回归方式统一文本、图像、视频理解与生成,无
近日,腾讯公益正式推出了 “问 AI” 功能,这是该平台首次将大型人工智能模型应用于公益领域。这项创新的功能允许用户就腾讯公益的各类项目和机构进行提问,旨在提升公众与公益组织之间的互动和透明度。“问 AI” 功能的上线,标志着腾讯在公益事业上的又一次突破。用户只需简单地输入问题,系统便能即时提供相关信息,帮助用户更好地理解和参与各类公益活动。这种便捷的沟通方式不仅提升了公益信息的获取效率,也使得更多人能够轻松参与到公益事业中来。腾讯公益在推广
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、🌟 OpenAI 宣布免费向所有 ChatGPT 用户开放记忆功能OpenAI 更新支持文档,宣布将记忆功能免费向所有 ChatGPT 用户开放,包括登录的免费用户,提升个性化对话体验。【AiBase提要:】💬 记忆功能支持短期对话连续性,免费用户可体验基础版本。💰 付费用户可引用更久远对话记录,享受更高便捷性
在今天举办的华为智能穿戴与运动健康新品技术沟通会上,华为正式发布了其最新旗舰产品 —— 华为 WATCH5智能手表。这款手表不仅在外观设计上继续追求时尚与科技感,更是在功能上进行了重大的技术升级,尤其是在运动健康领域。华为 WATCH5将接入两个强大的人工智能大模型 —— 盘古大模型和 DeepSeek 大模型。这两个模型的引入,将使手表在语音交互、运动健康监测和生态互联方面带来显著的提升。用户可以通过语音指令更加便捷地操作手表,同时也能获得更加准确和个性化的健康数据
近日,中国水利部在 “水利标准 AI 大模型” 的发布会上,宣布该模型已成功投入使用,标志着我国水利标准化管理进入智能化新阶段。该模型由中国水科院自主研发,整合了丰富的多源数据,为水利领域的标准制定和管理提供了强有力的支持。这款 AI 大模型以 “SkyLIM” 体系为基础,搭载了 “海量知识库 + DeepSeek/Qwen 双模型 + 标准服务” 的技术架构。通过运用自然语言处理、知识图谱和多模态数据融合等前沿技术,它实现了水利标准在立项、制定、实施和监督等全过程的数字化管理。这
近日,中国水利部国科司主办,水利科学研究院自主研发的 “水利标准 AI 大模型” 正式发布。这一创新成果旨在提升我国水利标准的管理效率,推动水利领域的智能化发展。该模型的发布标志着我国在水利标准化工具方面迈出了重要的一步。图源备注:图片由AI生成,图片授权服务商Midjourney该 AI 大模型基于中国水科院的 “SkyLIM” 体系,采用了先进的技术架构,包括 “海量知识库”、“DeepSeek/Qwen 双模型” 和 “标准服务”。通过整合自然语言处理、知识图谱和多模态数据融合等多种技
随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。论文中,研究者们特别提到,尽管这些 AI 模型在给出答案之前,往往会生成一系列看似合理的中间过程,但这并不意味着它们在进行推理。研究小组强调,这种将 AI 模型行
最近,华为通过其新推出的 “昇腾 + Pangu Ultra MoE” 系统展示了一个令人惊叹的突破:一个近万亿参数的 MoE 大模型在短短2秒内就能理解并解答一道高等数学题。而这一切都在没有使用 GPU 的情况下实现,显示出华为在自主可控的国产算力和模型训练方面的强大能力。在技术层面,华为的团队成功提升了训练系统的整体性能,通过智能选择并行策略和优化计算通信,大幅提高了集群的训练效率。在其技术报告中,华为详尽披露了在 CloudMatrix384超节点上进行的多项技术创新,包括改进的通信机