智源推Vision Mamba 高效处理视觉任务,内存能省87%

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-reasoning 拥有140亿个参数,并借鉴OpenAI o3-mini的推理路径,通过监督微调进行训练。更高级的Phi-4-reasoning-plus在此基础上增加了强化学习机制,处理的tok
阿里云旗下通义千问(Qwen)团队正式发布Qwen3系列模型,共推出8款不同规格的模型,覆盖从移动设备到大型服务器的全部应用场景。这是国内首个全面超越DeepSeek R1的开源模型,也是首个配备混合思维模式的国产模型。模型阵容丰富,满足各类部署需求Qwen3系列包含6款Dense模型和2款MoE模型:Dense模型:0.6B、1.7B、4B、8B、14B、32BMoE模型:Qwen3-235B-A22B (总参数235B,激活参数22B)Qwen3-30B-A3B (总参数30B,激活参数3B)所有模型均支持128K上下文窗口,并配备了可手动控制的"thinking"开关,实现混合思维模
开源人工智能的星空,昨夜骤然被一颗新星照亮!备受瞩目的 Step1X-Edit 图像编辑框架,已于2025年4月24日正式登陆 Hugging Face 社区,瞬间点燃了全球开发者和创意工作者的热情。这不仅仅是又一个开源工具的发布,更像是一次对现有图像编辑格局的强力挑战。据悉,Step1X-Edit 巧妙地将强大的多模态大语言模型(Qwen-VL)与先进的扩散变换器(DiT)深度融合,赋予用户通过简单的自然语言指令,即可实现令人惊叹的高精度图像编辑能力。其表现出的卓越性能,甚至敢于直接叫板像 GPT-4o 与 Gemini2Flash
JEDEC 固态技术协会宣布推出备受期待的高带宽内存(HBM)标准 ——HBM4。作为 HBM3标准的进化版本,HBM4旨在进一步提升数据处理速度,同时保持更高的带宽、能效及单个芯片或堆叠的更大容量,满足对大数据集和复杂计算的高效处理需求。HBM4标准带来了多项关键技术改进,适用于生成式人工智能、高性能计算、高端显卡及服务器等应用。首先,HBM4的带宽大幅提升,支持每秒高达8Gb 的传输速率,通过2048位接口实现总带宽高达2TB/s。其次,HBM4将每个堆叠的独立通道数量从16个增加到32个,使得
生数科技正式推出Vidu Q1,一款高性能生成式AI视频模型,以其极致的视觉质量、流畅的电影级过渡、精准音效和增强的动画风格引发行业热议。据AIbase了解,Vidu Q1在VBench综合视频生成评估标准中超越了现有竞品,凭借四大核心功能的全面升级,为创作者提供了媲美专业影视工作室的创作体验。项目详情已在Vidu官网与社交平台公布,标志着AI视频生成技术的新里程碑。核心功能:四大升级赋能沉浸式创作Vidu Q1通过技术突破实现了从视觉到听觉的全面优化。AIbase梳理了其四大核心功能: 极致画
AMD 在 AI 领域的进展值得关注,尤其是其最新发布的针对 Stable Diffusion 模型的优化。近日,Stability AI 推出了基于 ONNX 框架优化的 Stable Diffusion 版本,这意味着 AMD 的 Radeon 显卡和锐龙集显在运行 AI 任务时性能提升显著,最高可达3.8倍。这一进展不仅缩小了与 NVIDIA 在生态系统优化方面的差距,也为 AMD 用户带来了实实在在的好处。过去一年,AMD 与多个合作伙伴,包括操作系统供应商(OSV)、原始设备制造商(OEM)和独立软件开发商(ISV),在硬件设计、驱动程序、编译器和机器学习模型等方面紧
字节跳动Seed团队正式发布了Seedream3.0文生图模型的技术报告。这一模型在性能上实现了重大提升,是一个原生高分辨率、支持中英双语的图像生成基础模型,在分辨率、生图结构准确性等多方面取得突破,与上一版本相比优势显著。Seedream3.0在不同维度上的表现。本图各维度数据以最佳指标为参照系,已进行归一化调整。在功能亮点上,Seedream3.0可原生2K直出,无需后处理就能输出高分辨率图像,满足多种场景需求;出图速度极快,仅需3秒,极大提升创作效率;小字生成和文本排版效果得到优
近日,科技巨头 OpenAI 宣布收购初创公司 Context.ai 团队,这一举措旨在提升其 AI 模型的评估与分析能力。Context.ai 成立于2023年,由前谷歌员工 Henry Scott-Green 和 Alex Gamble 共同创办,专注于为开发者提供 AI 模型性能的深入分析和可视化工具。此举显示出 OpenAI 对提升 AI 技术的决心,尤其是在日益复杂的 AI 模型面前。作为此次收购的一部分,Scott-Green 和 Gamble 将加入 OpenAI,担任产品经理,专注于研发高效的模型评估工具。Scott-Green 在 LinkedIn 上已经更新了他的职位,表示他将负责 “构建评估工
人工智能(AI)模型的发展速度让人眼花缭乱,技术开发者们在不断提升其性能的同时,也引发了用户对于模型表现真实度的疑虑。为了解决这一问题,由杰弗里・辛顿(Geoffrey Hinton)创办的 Vector Institute 为人工智能研究推出了《评估现状研究》。该研究通过互动排行榜对11个顶尖的开放源代码和闭源模型进行了全面评测,涵盖了数学、通用知识、编码、安全性等16个基准。Vector Institute 的 AI 基础设施与研究工程经理约翰・威尔斯(John Willes)表示:“研究人员、开发者、监管者和最终用户可以
由著名 AI 科学家李飞飞领衔的斯坦福大学人工智能研究所发布了最新一期《2025年人工智能指数报告》。这份连续发布八年的权威报告指出,中国和美国作为全球最具影响力的两大 AI 国家,其顶级 AI 大模型之间的性能差距已大幅缩小至0.3%,与2023年的17.5% 相比几乎可以忽略不计。报告评选出了2024年的全球重要大模型(Notable Models),在总共61个入选模型中,谷歌和 OpenAI 各有7个模型入选并列第一,阿里巴巴以6个模型入选,其模型贡献度位列全球第三,也是入选重要模型数量最多的中国科技