Hugging Face推出aMUSEd模型,几秒钟内生成图像

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
【AI日报速览】1.智谱推出免费AI Slides,基于GLM模型快速生成专业PPT;2.可灵AI发布可图2.1,图像生成支持180种风格;3.NVIDIA推出DiffusionRenderer,实现视频转3D场景编辑;4.墨刀AI上线30秒生成可编辑原型功能;5.Higgsfield Soul ID用10张照片生成虚拟形象;6.谷歌开源GenAI Processors构建AI工作流;7.谷歌Veo3新增图转视频功能;8.Mistral AI发布专注代码生成的Devstral2507系列模型。
墨刀AI推出30秒快速原型生成功能,支持多终端适配和对话优化。用户可通过文本、草图等多种输入方式生成高保真可编辑原型,并支持多轮对话调整。AI能智能解析上传的草图、线框图等,自动生成界面。提供双模式编辑、自动文档生成和代码联动功能,覆盖电商、社交等多场景需求,显著降低原型制作门槛,提升产品设计效率。
智谱AI推出革命性PPT生成工具AI Slides,基于最新GLM-Experimental模型开发。用户只需输入主题或上传文档,即可自动生成专业级PPT,包含智能排版、图表设计和视觉优化。该工具适用于商业报告、学术演示等场景,目前完全免费开放体验。社交媒体反馈显示其生成效果媲美专业设计,显著提升办公效率。用户可通过智谱清言官网抢先体验这一智能办公新功能。
智谱推出免费AI PPT生成工具"AI Slides",基于GLM-Experimental模型,用户只需输入主题或文档即可自动生成结构清晰、排版专业的演示文稿。该功能支持数据可视化呈现,突出关键信息,大幅提升制作效率。目前可在chat.z.ai平台体验,适用于商务汇报和学术展示等多种场景。
谷歌为Veo3AI视频生成器新增图像转视频功能,该功能已整合进Gemini应用和Flow工具,覆盖150多国。目前仅限AI Ultra/Pro用户使用,每日限3次创作。用户可上传图片并添加音频描述生成视频,支持下载分享。数据显示7周内用户已创建超4000万视频。所有生成视频均带有可见"Veo"水印和不可见SynthID数字水印,谷歌还提供专用检测工具识别AI内容。
可灵AI推出新一代图像生成模型"可图2.1",在指令理解、人像美感和电影质感等方面全面提升。新模型具备强大文字生成能力,支持180多种风格,7月17日前会员可免费体验。该模型能精准呈现复杂场景,如3D沙盘、海底火山爆发等宏大场面,在人像光影处理上尤为出色。可灵AI已发展为多模态创意平台,用户累计生成3.44亿张图片和1.68亿个视频,展现强大技术实力和市场影响力。
Hugging Face推出两款Reachy Mini桌面机器人套件:无线版449美元和Lite版299美元,专为AI开发者设计。这些开源机器人可编程、支持Python,预装演示程序并与Hugging Face Hub平台深度集成。CEO表示产品基于社区反馈开发,旨在让开发者自由创造AI应用。Lite版下月发货,无线版年底交付。公司强调开源硬件理念,反对机器人技术被少数公司垄断。
OpenAI计划推出AI浏览器挑战谷歌Chrome,该产品基于Chromium开发,整合ChatGPT技术,拥有4亿潜在用户。其创新点在于AI代理功能可自动完成网页操作,减少传统浏览步骤。此举可能威胁谷歌66%的市场份额及其广告生态系统。目前行业正兴起AI浏览器热潮,OpenAI凭借技术优势试图抢占先机,若成功将动摇谷歌在用户数据和广告投放领域的主导地位。
【AI日报速览】阿里开源ThinkSound音频生成模型,支持链式推理实现高保真空间音频;谷歌Veo3升级,单图即可生成专业运镜视频;Hugging Face发布30亿参数SmolLM3模型,支持双模式推理;阿里WebSailor智能体展现强大检索能力;Moonvalley推出1080P无版权风险视频模型;Vidu Q1支持7图融合生成一致性视频;苹果研发AI客服助手优化用户体验;飞书发布多款企业AI产品及成熟度模型;微软等科技巨头联合成立AI教育学院,投入2300万美元培训教师。
Hugging Face推出3B参数开源模型SmolLM3,性能媲美4B参数模型。该模型采用GQA和NoPE技术优化,支持128K长上下文和六种语言处理,在多项基准测试中表现优异。创新性地提供"思考"与"非思考"双推理模式,复杂任务性能提升显著。完全开源训练数据与代码,适合边缘设备部署,为教育、客服等场景提供高性价比解决方案。其开源特性将推动AI生态发展,展现小模型的巨大潜力。