邢波团队提出全面开源LLM360倡议,推动大型语言模型透明训练

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,NVIDIA 的研究团队宣布发布 Jet-Nemotron,这是一系列全新的语言模型(包含2亿和4亿参数的版本),其生成速度比当前最领先的全注意力语言模型高出53.6倍,并在准确性上达到了甚至超过了这些模型的水平。这一突破不是通过从头开始重新训练模型实现的,而是采用了一种名为 “后神经架构搜索”(PostNAS)的新技术对现有预训练模型进行了改造。随着现代语言模型的广泛应用,如 Qwen3、Llama3.2和 Gemma3等,这些模型虽然在准确性和灵活性上设立了新的标杆,但其 O (n²) 的自注意力机制造
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、谷歌推出全新的Gemini 2.5 Flash图像编辑模型谷歌DeepMind推出的Gemini 2.5 Flash图像编辑模型在精准编辑和创意实现方面表现出色,支持角色一致性、局部文字编辑、风格迁移和现实推理等功能,为用户提供了强大的图像处理工具。【AiBase提要:】✨ Gemini 2.5 Flash 提供了更精准的图像编辑体验,允许
近日,字节的新AI视频模型Waver1.0正式发布,这是一款集多种功能于一体的视频生成模型,具有更强大的能力。Waver1.0支持文本到视频和图像到视频的转换,为用户提供了一种全新的创作体验。该模型在视频生成的质量和效果上,显著优于现有的开源和闭源模型。在模型性能方面,Waver1.0在 Waver-Bench1.0和 Hermes Motion Testset 上的表现非常突出。在运动质量、视觉质量和提示跟随性等方面,经过人工评估,Waver1.0均显示出其优越性。Waver1.0还具备多镜头叙事的能力,能够生成多镜头的连贯叙事视频
在开发者的积极反馈下,文心快码近日发布了一系列新功能,旨在提升个人开发体验和企业级协作效率。这些新能力包括 Zulu-CLI 的引入、企业版自定义模型的支持、一键设置自动执行、复用相同终端以及本地代码库知识增强索引的支持等,让开发者的工作流程更加顺畅。首先,Zulu-CLI 的推出使得开发者可以在终端中使用其强大的智能编码能力。通过自然语言命令,开发者无需离开熟悉的命令行界面,即可实现各种编码需求。为了顺利使用 Zulu-CLI,开发者需要确保环境符合要求,并根据各自
AIbase报道 谷歌翻译近日宣布进行重大升级,正式推出基于其最新Gemini大模型技术的实时同声传译功能,彻底改变了传统的对话模式。这项创新不仅能实现即时语音翻译,同时还配备了实时字幕,让跨语言沟通变得前所未有的流畅与高效。本次升级的核心是Gemini强大的推理和多模态能力。除了革命性的同声传译功能外,谷歌翻译还新增了一项名为“语言练习伙伴”的实用功能,旨在帮助用户通过定制化的场景练习来提升口语技能。用户只需在应用中点击“练习”选项,设置自己的技能水平和
近日,谷歌发布了一种新型人工智能模型,专门用于预测热带气旋的路径和强度。这个模型是谷歌 DeepMind 团队开发的 “天气实验室” 气象研究模型的一部分,旨在提升气象预报的准确性。在模型发布之初,气象学家们对此有些陌生,但随着飓风季节的到来,它很快得到了实战检验。图源备注:图片由AI生成,图片授权服务商Midjourney谷歌在其博客中指出,该模型通过一个庞大的历史气象数据集进行训练,这个数据集包含了飓风的路径、强度和规模等关键信息。在内部测试中,谷歌的模型显
在全球人工智能领域持续创新的背景下,谷歌于近日正式推出了其最新的图像模型 ——Gemini2.5Flash Image。该模型不仅支持中文,还提供免费使用的服务,迅速在海外社交媒体上引起了热烈反响,尤其是以 “香蕉人” 图像为代表的生成作品受到了广泛关注。Gemini2.5Flash Image 的强大功能使其在图像生成、编辑和融合方面表现出色。用户只需通过简单的文本提示,就可以实现复杂的图像编辑。例如,当用户上传一张著名足球员卡洛斯的图片时,只需输入 “把他的头部 P 成香蕉人”,系统就能完
近日,科技媒体 The Decoder 报道,谷歌 DeepMind 推出了全新的 Gemini2.5Flash 图像编辑模型。这款升级版模型在 Gemini 应用中为用户提供了更加精准的图像编辑体验,允许用户通过文字指令对照片进行大幅修改,而不影响人物和动物的外观。与之前的图像生成工具相比,Gemini2.5Flash 在处理复杂的文字指令时展现出了更高的准确性,甚至在多项任务中超过了 ChatGPT 使用的 GPT-4o。这一进步让用户在进行图像编辑时,能够更轻松地实现他们的创意。Gemini2.5Flash 的一个亮点是其 “角色一致性” 功能。即
【AIbase 报道】Anthropic 周二宣布,将推出基于浏览器的人工智能代理 Claude for Chrome 的研究预览版。该代理由 Claude AI 模型驱动,正向 Anthropic Max 套餐的1000名订阅用户率先开放(订阅费用每月100至200美元),并已为其他用户开启候补名单。通过安装 Chrome 扩展程序,部分用户可在浏览器 Sidecar 窗口中直接与 Claude 交互。Claude 不仅能保持网页操作上下文,还可在用户授权下执行浏览器操作、代办任务。浏览器正成为 AI 实验室的新战场。Perplexity 近期发布了 AI 浏览器 Comet,而 OpenAI 也被曝即将推
近日,阿里国际正式发布了其新一代多模态大模型 Ovis2.5,并对外开源。这款模型专注于原生分辨率视觉感知、深度推理以及高性价比的场景设计,旨在进一步提升人工智能的应用能力。Ovis2.5在主流多模态评测套件 OpenCompass 上的综合得分相比前一版本 Ovis2有了显著提升,继续在同类开源模型中保持 SOTA(最先进技术)水平。此次发布的 Ovis2.5包含两个不同参数规模的版本。首先是 Ovis2.5-9B,这一版本在 OpenCompass 评测中获得了78.3的高分,超越了许多参数量更大的模型,并在40B 以下参数规模的