Hugging Face推出aMUSEd模型,几秒钟内生成图像

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
快手发布KAT系列大模型KAT-Dev-32B和KAT-Coder,在代码智能领域表现突出,为开发者提供高效AI编程工具。
腾讯发布业界首个开源商用级原生多模态生图模型混元图像3.0,拥有80亿参数,效果领先且参数量最大,媲美顶尖闭源模型。用户可通过官网体验,模型权重及加速版已在GitHub、Hugging Face等平台开源,供开发者免费使用。其亮点在于原生多模态技术架构。
腾讯开源原生多模态图像生成模型“混元图像3.0”,参数规模达80B,实现技术突破。作为首个开源工业级多模态生图模型,其性能媲美顶尖闭源模型。该模型具备强大推理能力,可解析复杂千字级语言,生成高质量图像。
Moondream3.0预览版以轻量高效的混合专家架构(总参9B,激活仅2B)引领视觉语言模型革新。它在复杂场景中表现卓越,多项基准测试超越GPT-5、Gemini和Claude4等主流模型。相比擅长验证码识别的2.0版,3.0版显著扩展了视觉推理能力,引发AI社区广泛关注。
腾讯混元开源多模态图像生成模型“混元图像3.0”,参数规模达80B,为首个开源工业级原生多模态生成模型。其生成效果媲美领先闭源模型,亮点在于可处理复杂语义,解析千字文本并生成对应图像,具备知识推理能力。
L&T科技服务公司(LTTS)与西门子深化合作,共同推进机器与生产线仿真技术及工业物联网(IIoT)发展。此次合作将聚焦工艺工程、离散制造和工业产品等领域,助力LTTS在可持续发展方面树立创新标杆。通过整合西门子数字化技术,LTTS将提升行业解决方案能力,推动工业智能化转型。
苹果推出新型图像模型Manzano,兼具图像理解与生成能力,解决了开源模型的技术瓶颈。其效率与效果接近OpenAI和谷歌的商业系统。目前模型未公开,仅发布研究论文及少量低分辨率图像示例。
谷歌DeepMind推出Gemini Robotics项目,首次实现机器人行动前“思考”能力。通过两个协同模型,该系统突破传统机器人仅执行固定任务的局限,将生成式AI从文本、图像创作延伸至动作指令输出,有望彻底改变机器人技术发展路径。
蚂蚁数科推出隐私保护AI训练框架Gibbon,解决跨机构联合建模中数据隐私与高效计算的矛盾,技术获国际会议ACM CCS和IEEE TDSC收录,彰显其前沿性与实用性。Gibbon框架创新安全机制,推动隐私计算领域进步。
DeepSeek发布V3.1-Terminus版本,暗示V3系列或将收官。本次更新重点提升模型稳定性,修复了此前“极你太美”异常输出问题,通过优化语言处理机制解决不当回复缺陷。版本命名预示产品线重要转折,技术团队集中改进系统可靠性。