NVIDIA推出Tied-Lora技术:提升LoRA方法参数效率

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
工智能公司Anthropic向白宫发出呼吁,要求进一步加强针对人工智能扩散的出口管制。这些出口管制自今年五月中旬起,将限制或禁止将高端 GPU 及加速器出售给中国及部分国家。Anthropic表示,现有的出口管制措施仍不足以遏制走私芯片流入中国,从而推动其人工智能的持续进步。Anthropic在一份简报中指出,中国在一月份发布的免费大型语言模型(LLM)已经在某些基准测试中超越了美国公司的模型,这让许多西方人工智能公司感到担忧。针对美国政府发布的三层次出口管制方案,Anthropic希望
NVIDIA宣布推出NIM Operator2.0,专为Kubernetes环境设计,旨在简化NIM和NeMo微服务的部署、扩展与管理。据AIbase了解,新版本引入了定制器(Customizer)、评估器(Evaluator)和防护栏(Guardrails)等全新自定义资源定义(CRDs),显著提升了企业级AI工作流的效率与安全性。社交平台上的热烈反响凸显了其对AI开发社区的重大影响,相关细节已通过NVIDIA官网(nvidia.com)与Hugging Face公开。AIbase为您带来深度报道。核心功能:全新CRDs赋能微服务管理NIM Operator2.0通过增强的Kubernetes集成与新增功能,为AI微服务部署提供了
NVIDIA AI团队发布了一款革命性的多模态大语言模型——Describe Anything3B(DAM-3B),专为图像和视频的精细化、区域化描述而设计。这款模型凭借创新技术和卓越性能,在多模态学习领域掀起热议,成为AI技术发展的又一里程碑。以下,AIbase为您梳理这款模型的核心亮点与行业影响。区域化描述的突破DAM-3B以其独特的能力脱颖而出:能够根据用户指定的图像或视频区域(如点、框、涂鸦或掩码),生成高度详细的描述。这种区域化描述超越了传统图像标注的局限,结合全局图像/视频上下文与局
Nvidia 近期宣布,将在美国本土首次制造其 AI 超级计算机。这一举措标志着该公司与一系列制造合作伙伴共同合作,旨在在美国工厂内建造、包装、测试和组装下一代 Blackwell 系统。目前,Blackwell 芯片的生产已经在位于亚利桑那州的 TSMC 半导体制造厂展开,而超级计算机的组装则将在德克萨斯州进行,由富士康在休斯顿和纬创在达拉斯进行扩展。此外,负责包装和测试的安靠和矽品,也在亚利桑那州扩大了业务。Nvidia 预计,全面生产将在未来12到15个月内逐步提升。为此,该公司已经租赁了
谷歌近期推出了 Gemma3系列的全新版本,这一消息让众多 AI 爱好者为之振奋。仅在上线一个月后,谷歌便发布了经过量化感知训练(QAT)优化的 Gemma3,旨在显著降低内存需求的同时,保持模型的高质量。具体来说,经过 QAT 优化的 Gemma327B 模型,其显存需求从54GB 大幅降低到14.1GB,意味着用户现在可以在 NVIDIA RTX3090等消费级 GPU 上本地运行这一大型模型。通过简单的测试,配备 RTX3070的机器也能运行 Gemma3的12B 版本,尽管其 token 输出速度稍显不足,但整体性能仍在可接受范围之内。QAT 的神奇
2025年4月9日,在Google Cloud Next2025大会上,Google Cloud宣布了一项重大合作计划,将其分布式云服务Google Distributed Cloud(GDC)与Gemini人工智能模型和NVIDIA的Blackwell架构相结合,为企业提供强大的本地化AI解决方案。这一合作旨在满足对数据主权和安全性有严格需求的行业,推动“代理AI”(Agentic AI)技术在本地环境中的应用。据最新消息,Google Distributed Cloud将支持Gemini模型在企业自有数据中心运行。这一举措通过与NVIDIA的合作得以实现,具体利用NVIDIA最新推出的Blackwell GPU系统,提供高性能计算能
2025年4月8日,英伟达(NVIDIA)宣布推出其最新大型语言模型(LLM)——Llama3.1Nemotron Ultra253B。这一模型基于Meta的Llama-3.1-405B-Instruct开发,通过创新的神经架构搜索(NAS)技术进行了深度优化,不仅在性能上超过了近期发布的Llama4系列中的Behemoth和Maverick,还以开源形式在Hugging Face平台上发布,引发了AI社区的广泛关注。性能突破:碾压Llama4Behemoth和Maverick根据英伟达官方披露的信息以及社交媒体上的最新讨论,Llama3.1Nemotron Ultra253B在多个关键基准测试中表现出色。这一模型拥有2530亿个参数,相较于Lla
Nvidia 最近发布了其实验性 AI 助手 Project G-Assist,该工具可以在 GeForce RTX 卡上本地运行。这一发布是在2024年 Computex 展会上的首次预览后进行的标志着科技公司在为玩家开发专用 AI 助手方面迈出了重要一步。例如微软也在开发一款名为 “Gaming C o p i l o t” 的助手,最初将提供游戏技巧的聊天支持,并计划在后续更新中实时分析游戏场景。G-Assist 与许多需要互联网连接和订阅服务的云端 AI 助手不同,它完全依赖于用户的 GeForce RTX GPU 来运行。该助手使用了基于 Llama 的8亿参数模型,通过按下
苹果公司近期在人工智能领域的投资动作引起了广泛关注。根据 Loop Capital 分析师 Ananda Baruah 的报告,苹果公司正在斥资10亿美元购买 NVIDIA 的 AI 系统,以支持其 Apple Intelligence 的运行。虽然苹果之前曾表示依靠自家的 Apple Silicon 服务器来处理相关任务,但如今的投资显示出其在技术领域的进一步布局。图源备注:图片由AI生成,图片授权服务商MidjourneyBaruah 在报告中指出,苹果正式加入了大型服务器集群的人工智能竞争中,与超微(Super Micro Computer)和戴尔等公司成为重要的服务器合作伙伴
近日,AI 驱动的服务机器人制造商 Richtech Robotics 在乔治亚州皮奇特市的一家沃尔玛超市内开设了新餐厅 “One Kitchen”,并推出了由 Nvidia AI 技术驱动的机器人服务咖啡、奶茶和水果茶等饮品。该餐厅与 Ghost Kitchens America 合作运营,机器人 Scorpion 负责与顾客互动、监控环境并制作饮品。与此同时,Richtech 的另一款人形机器人 Adam 正在拉斯维加斯的一家餐厅为顾客提供咖啡和甜点。Adam 在 “Clouffee and Tea” 餐厅内工作,与店员配合,后者负责售卖 Adam 无法制作的零食或瓶装饮料。顾客在与 Adam