AI大模型时代的到来,带来了巨大机遇与挑战。算力不足成为制约大模型应用的主要瓶颈。未来趋势包括专用算力、分布式训练、能耗可持续性、软硬结合。
相关AI新闻推荐

思科与 Meta 携手推出网络安全新武器:Foundation-sec-8B 大模型
思科(Cisco)与 Meta 的合作为我们带来了一个令人振奋的新进展。他们共同发布了名为 Foundation-sec-8B 的开源大型语言模型(LLM),该模型专门针对网络安全领域,具有80亿个参数。这一创新产品不仅展现了两大科技巨头的强强联手,也预示着网络安全技术的新纪元。Foundation-sec-8B 模型基于 Meta 最新的 Llama3.1架构,由思科新成立的研发团队开发。团队在训练过程中,利用了精选的网络安全数据集,使得该模型在应对各种网络威胁时表现尤为出色。这些威胁包括但不限于网络攻击、数据泄露和恶意

IBM 首席执行官呼吁特朗普政府增加人工智能研发资金
在科技领域的众多领袖中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,联邦对人工智能及相关技术的研发资金应该增加,而不是削减。在接受 采访时,克里希纳明确指出:“我们公司以及我个人都强烈主张,联邦资助的研发应该增加。这是毫无疑问的立场,我们坚信这一点。”特朗普总统及其内阁近期寻求大幅削减联邦拨款和科学研究项目,推动与以往政府不同的优先事项。最近,一个负责人工智能研究的关键联邦机构 —— 技术、创新与合作处(TIP)面临严峻的预算削减。同

理想汽车李想宣布 AI Talk 第二季:探讨人工智能的未来与发展
理想汽车创始人兼 CEO 李想在社交平台上宣布,《AI Talk 第二季》将于5月7日晚上8点正式上线。在这一季中,他将与观众分享自己对人工智能最新的思考,尤其是理想 VLA 司机大模型的创新理念。李想表示,VLA 司机大模型不仅是技术的结晶,更是生物进化的延续,从动物智能到人类智慧的跃迁。在即将到来的节目中,李想将重点解答以下三个引人关注的问题:首先,他将探讨为什么理想 VLA 司机大模型被视为从动物到人类的进化过程。他指出,汽车行业正在经历一场前所未有的智能革命,VLA

IBM 首席执行官进军人工智能市场并加大美国投资
在最近的一次采访中,IBM 首席执行官阿尔温德・克里希纳(Arvind Krishna)表示,随着人工智能(AI)市场竞争的加剧,IBM 正计划通过提供能够整合客户使用的不同 AI 代理的工具,来提升其在该领域的销售。这些工具将帮助客户管理他们在关键业务应用中的一系列 AI 代理,主要包括 Salesforce、Workday 和 Adobe 等公司的产品。克里希纳指出,IBM 将助力客户构建适合未开发用例的 AI 代理,客户只需在五分钟内完成创建。IBM 的这些工具将基于 IBM Granite 系列的 AI 模型,并结合来自 Meta 平台和 Mistral 等

实时口语聊天大模型 LLaMA-Omni 2 来了,能让你的 AI 聊天体验起飞!
最近 AI 圈可是热闹非凡,今天咱们就来聊聊其中的 “狠角色”——LLaMA-Omni2。这是一系列超厉害的语音语言模型(SpeechLMs),参数规模从0.5B 到14B 不等,专门为实现高质量实时语音交互而生,在 Hugging Face 上一经发布,就引起了广泛关注。语音交互发展历程回顾:从 “卡顿” 到 “丝滑”语音交互在人机交互领域的地位愈发重要,它就像是为我们打开了一扇便捷的大门,极大地提升了交互效率和用户体验。大家想想,以前操作设备只能靠手动输入,现在只需动动嘴就能搞定,多方便!随着像

商汤科技携手中移动香港与香港中文大学法学院 开展视觉 AI 与大模型领域合作
近日,商汤科技在香港与中国移动香港有限公司及香港中文大学法学院签署了合作备忘录,正式启动在视觉人工智能(AI)与大模型技术等领域的深入合作。这一合作旨在利用三方的优势,共同推动科技的创新与应用,助力香港及中国的科技发展。商汤科技作为一家领先的人工智能企业,在视觉 AI 领域具有丰富的经验和技术积累。通过与中国移动香港的合作,商汤希望借助后者的网络基础设施和市场资源,将视觉 AI 技术应用于更广泛的领域,例如智慧城市、智能交通和公共安全等。同时,

南天信息与新华三合作推出行业领先的大模型一体机
近日,南天信息的子公司海捷科技与紫光集团旗下的新华三集团达成深度合作,联合推出了一款基于新华三 LinSeer Cube 的大模型一体机。这一新产品的发布,标志着在人工智能领域内又一次重要的技术进步,特别是在行业应用方面。随着人工智能的迅猛发展,企业在数字转型和智能化进程中亟需高效、便捷的解决方案。海捷科技和新华三的合作正是针对这一市场需求而生。新推出的 LinSeer Cube 大模型一体机,不仅集成了先进的 AI 技术,还提供了一系列行业定制的解决方案,旨在为企业提供

谷歌DeepMind:大模型明知到最优解,但还是故意绕了一圈
现在的大模型(LLMs)已经非常智能。写文章、编代码、当医生、当老师,样样精通。于是乎,有人就想了:既然它们这么聪明,能不能让它们自己做决定,当个“智能体”呢?比如,在复杂的环境里自己探索、自己解决问题。毕竟,大家觉得LLMs肚子里有“世界知识”,不需要手把手教也能猜到怎么干。而且,它们还有“思维链”(Chain-of-Thought,CoT)这种“聪明脑回路”,能一步一步推理,更好地理解环境和自己的行为。听起来是不是很完美?结果呢?啪!打脸了。研究人员发现,这些LLM智能体

阿联酋从幼儿园起普及人工智能课程,全球应效仿
阿联酋近日宣布了一项全国性计划,将人工智能(AI)作为所有学生从幼儿园到高中必修的课程。该政策将在2025-2026学年正式实施,届时所有公立学校都将把 AI 课程纳入核心教学体系。阿联酋官员表示,私人学校也可能会在国家指导下跟进这一政策,旨在为年轻一代做好迎接科技驱动未来的准备,增强他们的 AI 技能,巩固阿联酋在区域内的 AI 和数字创新领导地位。图源备注:图片由AI生成,图片授权服务商Midjourney新课程结构经过精心设计,按年龄层逐步引入七个关键学习领域,包括基础

研究称,流行的人工智能基准 LMArena 据称有利于大型供应商
Salesforce AI Research发布多项创新,旨在解决企业AI系统在强大智能与稳定执行力之间的差距,即“锯齿状智能”。核心目标是构建更智能、可信、适用于企业应用的AI代理,并向“企业通用智能”(EGI)迈进。研究重点在于量化和解决AI性能不一致性,推出了SIMPLE数据集作为公开基准。更重要的是,Salesforce推出了CRMArena,一个模拟真实CRM场景的基准测试框架,用于全面评估AI代理在服务、分析和管理等角色中的表现。早期测试显示,现有领先AI座席在函数调用成功率方面仍有提升空间。在模型