信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

最新AI日报

每日精选AI热点，追踪最新行业动态

信息

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

模型服务提交

提交模型信息和服务，精准推广和触达用户

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

GEO排名查询工具

检测品牌在AI平台中的可见度

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

信息

数据集合

提供用于训练、评估和测试模型的数据集

工具

智能文档识别解析

提供各类文档文字提取，支持自定义场景

AI应用指南

Hugging Face推出aMUSEd模型，几秒钟内生成图像

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Jan 5, 2024

97

Hugging Face推出的aMUSEd模型可以在几秒钟内生成图像，采用了轻量级的文本到图像模型，使用Masked Image Model（MIM）架构，大大减少了推理步骤，提高了生成速度和可解释性。aMUSEd模型可在Hugging Face上的演示中进行尝试，目前以研究预览版形式提供，使用OpenRAIL许可证，鼓励社区进一步探索非扩散框架用于图像生成。

Hugging Face aMUSEd 图像生成 MIM架构速度可解释性 VQGAN 微调

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

© 版权所有 AIbase基地 2024, 点击查看来源出处 -

相关AI新闻推荐

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Coding大模型；苹果悄然研发ChatGPT式应用

快手发布KAT系列大模型KAT-Dev-32B和KAT-Coder，在代码智能领域表现突出，为开发者提供高效AI编程工具。

2025年9月28号 16:16

开源！腾讯混元图像3.0正式上线，支持中英文精准渲染、长文本生成

开源！腾讯混元图像3.0正式上线，支持中英文精准渲染、长文本生成

腾讯发布业界首个开源商用级原生多模态生图模型混元图像3.0，拥有80亿参数，效果领先且参数量最大，媲美顶尖闭源模型。用户可通过官网体验，模型权重及加速版已在GitHub、Hugging Face等平台开源，供开发者免费使用。其亮点在于原生多模态技术架构。

2025年9月28号 14:17

腾讯重磅发布 “混元图像 3.0”，开创多模态图像生成新时代

腾讯重磅发布 “混元图像 3.0”，开创多模态图像生成新时代

腾讯开源原生多模态图像生成模型“混元图像3.0”，参数规模达80B，实现技术突破。作为首个开源工业级多模态生图模型，其性能媲美顶尖闭源模型。该模型具备强大推理能力，可解析复杂千字级语言，生成高质量图像。

2025年9月28号 13:49

小型VLM黑马逆袭：Moondream 3.0仅2B激活参数，碾压GPT-5和Claude 4

小型VLM黑马逆袭：Moondream 3.0仅2B激活参数，碾压GPT-5和Claude 4

Moondream3.0预览版以轻量高效的混合专家架构（总参9B，激活仅2B）引领视觉语言模型革新。它在复杂场景中表现卓越，多项基准测试超越GPT-5、Gemini和Claude4等主流模型。相比擅长验证码识别的2.0版，3.0版显著扩展了视觉推理能力，引发AI社区广泛关注。

2025年9月28号 12:02

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

腾讯混元开源多模态图像生成模型“混元图像3.0”，参数规模达80B，为首个开源工业级原生多模态生成模型。其生成效果媲美领先闭源模型，亮点在于可处理复杂语义，解析千字文本并生成对应图像，具备知识推理能力。

2025年9月28号 11:46

LTTS 与西门子携手推进智能制造与工艺工程的 AI 转型

LTTS 与西门子携手推进智能制造与工艺工程的 AI 转型

L&T科技服务公司(LTTS)与西门子深化合作，共同推进机器与生产线仿真技术及工业物联网(IIoT)发展。此次合作将聚焦工艺工程、离散制造和工业产品等领域，助力LTTS在可持续发展方面树立创新标杆。通过整合西门子数字化技术，LTTS将提升行业解决方案能力，推动工业智能化转型。

2025年9月28号 9:22

苹果推出新图像模型 Manzano 实现理解与生成双重能力

苹果推出新图像模型 Manzano 实现理解与生成双重能力

苹果推出新型图像模型Manzano，兼具图像理解与生成能力，解决了开源模型的技术瓶颈。其效率与效果接近OpenAI和谷歌的商业系统。目前模型未公开，仅发布研究论文及少量低分辨率图像示例。

2025年9月28号 9:08

谷歌DeepMind推出双AI机器人系统：会"思考"的Gemini Robotics 1.5让机器人告别单一任务束缚

谷歌DeepMind推出双AI机器人系统：会"思考"的Gemini Robotics 1.5让机器人告别单一任务束缚

谷歌DeepMind推出Gemini Robotics项目，首次实现机器人行动前“思考”能力。通过两个协同模型，该系统突破传统机器人仅执行固定任务的局限，将生成式AI从文本、图像创作延伸至动作指令输出，有望彻底改变机器人技术发展路径。

2025年9月26号 15:38

蚂蚁数科发布新隐私保护AI算法，推理速度提升超100倍

蚂蚁数科发布新隐私保护AI算法，推理速度提升超100倍

蚂蚁数科推出隐私保护AI训练框架Gibbon，解决跨机构联合建模中数据隐私与高效计算的矛盾，技术获国际会议ACM CCS和IEEE TDSC收录，彰显其前沿性与实用性。Gibbon框架创新安全机制，推动隐私计算领域进步。

2025年9月26号 14:35

DeepSeek V3.1终结版发布：修复关键漏洞提升稳定性，V4新架构呼之欲出

DeepSeek V3.1终结版发布：修复关键漏洞提升稳定性，V4新架构呼之欲出

DeepSeek发布V3.1-Terminus版本，暗示V3系列或将收官。本次更新重点提升模型稳定性，修复了此前“极你太美”异常输出问题，通过优化语言处理机制解决不当回复缺陷。版本命名预示产品线重要转折，技术团队集中改进系统可靠性。

2025年9月26号 14:29