欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、阿里发布超强语音合成模型Qwen3-TTS,49种音色满足你的声音需求!8、ChatGPT跃居苹果商店下载榜首,成美国用户最爱应用ChatGPT在2025年成为苹果美国市场上下载量最高的免费应用,首次登顶榜首,显示出人工智能在美国用户日常生活中的重要性。
商汤科技发布AI视频Agent「Seko2.0」,用户输入一句话即可一键生成最高100集剧情连贯、人物零崩坏的长篇动画短剧,制作成本极低。该产品采用多剧集记忆与全局一致性架构,确保角色形象、声音及世界观在百集内保持稳定,大幅降低AI动画制作门槛,现已开放测试。
Figma推出AI图像编辑新功能,包括套索一键删除/隔离对象、背景自动扩边及无文本提示的光照/色彩调整。套索2.0支持选中目标后直接删除或拖移,背景保持不变。新工具将首先在Figma Design与Draw中上线,明年覆盖全平台。
腾讯将自研大模型品牌“混元”更名为“Tencent HY”并升级至2.0版本。此举旨在提升品牌传播效率,适应全球市场,以简化名称更好地服务国际用户,是腾讯全球化布局的重要一步。
专业AI图像生成与编辑器,2-5秒产出2K/4K高质量图像,支持多语言
Seedance 2.0可将图像和文本转化为具有专业品质的电影级AI视频。
AI邮件营销工具,可创建邮件、自动化流程、添加互动性以提升转化率
体验重新定义的女友关系,与独特的 AI 女友进行有意义的对话。
Google
$0.49
输入tokens/百万
$2.1
输出tokens/百万
1k
上下文长度
Xai
$1.4
$3.5
2k
Anthropic
$105
$525
200
$0.7
$2.8
$7
$35
$17.5
Alibaba
-
$3.9
$15.2
64
Bytedance
$0.8
$2
128
Baidu
open-thoughts
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
Clemylia
Gheya-1是LES-IA-ETOILES生态系统中的新一代基础语言模型,拥有2.02亿参数,是旧版Small-lamina系列的升级版本。该模型专为专业微调而设计,在人工智能、专业语言模型和生物学领域具有针对性训练。
vanta-research
Atom-Olmo3-7B是基于Olmo-3-7B-Instruct微调的语言模型,专门为协作式问题解决和创造性探索而设计。该模型在处理复杂问题时能提供深思熟虑且结构化的分析,同时保持引人入胜的对话风格,具有Apache 2.0开源许可证。
HIT-TMG
Uni-MoE 2.0-Image 是基于 Uni-MoE 2.0-Omni 派生而来的视觉生成模型,在视觉生成数据上进行了专门微调,具备强大的图像生成和编辑能力。
Uni-MoE 2.0-Omni 是荔枝科技(Lychee)推出的完全开源全模态模型,采用全模态 3D RoPE 和动态容量专家混合架构,显著提升了以语言为中心的多模态理解、推理和生成能力。该版本集成了全模态理解以及音频和图像生成能力。
allenai
Olmo 3是Allen Institute for AI (Ai2)开发的全新32B参数语言模型家族,包含Base、Instruct和Think等变体。该模型基于Dolma 3数据集训练,支持65,536的长上下文处理,旨在推动语言模型科学发展。模型完全开源,遵循Apache 2.0许可证。
Mungert
gpt-oss-safeguard-20b是基于GPT-OSS-20b微调的安全推理模型,专门用于大语言模型输入输出过滤、在线内容标注以及信任与安全用例的离线标注。该模型采用Apache 2.0许可证,支持自定义策略和透明决策过程。
lefromage
这是Qwen3-Next-80B-A3B-Instruct模型的GGUF量化格式版本,由lefromage提供。该模型是一个800亿参数的大型语言模型,采用Apache 2.0许可证,支持文本生成任务。GGUF格式便于在本地设备上部署和运行。
textcleanlm
这是一个基于 unsloth/gpt-oss-20b-BF16 基础模型的内容保真模型,专门用于将原始文本转换为简洁、清晰的Markdown格式。模型采用Apache 2.0许可证,主要支持英语文本处理。
numind
NuExtract 2.0是由NuMind开发的专门用于结构化信息提取的多模态模型,支持文本和图像输入,具备多语言处理能力,能够根据JSON模板从输入内容中提取结构化信息。
NuExtract 2.0是NuMind公司专门为结构化信息提取任务训练的一系列多模态模型。该4B版本基于Qwen2.5-VL-3B-Instruct构建,支持文本和图像输入,具备多语言处理能力,能够从非结构化数据中提取结构化信息。
inclusionAI
Ring-mini-2.0是基于Ling 2.0架构深度优化的高性能推理型MoE模型,仅有160亿总参数和14亿激活参数,却实现了与100亿规模以下密集模型相当的综合推理能力。在逻辑推理、代码生成和数学任务方面表现出色,支持12.8万长上下文处理和每秒300+令牌的高速生成。
Ling 2.0是基于MoE架构的大语言模型家族,首个版本Ling-mini-2.0参数规模紧凑但功能强大,在复杂推理和指令遵循方面表现出色,采用1/32激活率的MoE架构,实现卓越性能与高效运行的完美结合。
Immac
NetaYume Lumina Image 2.0 是一个文本到图像的扩散模型,经过GGUF格式量化处理,能够将文本描述转换为图像。该模型经过优化,在保持生成质量的同时减少了内存使用和提升了性能。
0xShonen
GPT-OSS-20B是OpenAI发布的开放权重模型,专为强大的推理、智能体任务和多样化开发者用例设计。该模型具有21B参数(其中3.6B为活跃参数),支持低延迟推理和本地部署,采用Apache 2.0许可证,可自由用于实验、定制和商业部署。
giladgd
GPT-OSS-120b-GGUF 是 OpenAI 发布的 1200 亿参数开源文本生成模型,采用 Apache 2.0 宽松许可证,支持灵活的推理强度配置和完整思维链访问,具备原生函数调用、网页浏览和代码执行能力。
GPT-OSS-20b-GGUF 是一个基于 OpenAI GPT-OSS-20b 模型的量化版本,采用 Apache 2.0 许可协议,具有宽松的使用条款。该模型支持文本生成任务,具备完整的思维链推理能力,并经过原生 MXFP4 量化,可在不同内存条件下高效运行。
lodestones
Chroma1-HD是基于FLUX.1-schnell架构的文本到图像生成基础模型,拥有89亿参数,采用Apache 2.0开源许可。该模型专为微调设计,为开发者和研究人员提供了强大的图像生成基础,支持创建各种专业化的视觉内容。
unsloth
Qwen3-4B-Instruct-2507是阿里云推出的40亿参数大语言模型,基于Unsloth Dynamic 2.0量化技术,在通用能力、长尾知识覆盖、用户偏好对齐和长上下文理解等方面都有显著提升。
Qwen3-4B-Instruct-2507是Qwen3-4B非思考模式的更新版本,在通用能力、长尾知识覆盖、用户偏好对齐和长上下文理解等方面有显著提升。采用Unsloth Dynamic 2.0量化技术,在准确性上表现卓越。
MaverickMCP是一个基于FastMCP 2.0的个人股票分析服务器,为Claude Desktop等MCP客户端提供专业级的金融数据分析、技术指标计算和投资组合优化工具。它预置了520只标普500股票数据,支持多种技术分析策略和并行处理,无需复杂认证即可本地运行。
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
一个基于AWS Lambda、CloudFront和Cognito认证的无服务器MCP协议实现项目,提供完整的云端MCP服务器基础设施,支持OAuth 2.0认证、实时流传输和可扩展架构。
一个用Scala 3编写的MCP协议服务器,支持多种工具功能。
一个通过JSON-RPC 2.0协议控制微软画图的服务器,支持启动画图程序、绘制图形、设置颜色和工具属性等功能。
基于pyATS的MCP服务器,通过JSON-RPC 2.0协议实现结构化网络设备交互
一个用于Common Lisp的Model Context Protocol服务器,提供JSON-RPC 2.0通信、REPL评估工具和TCP/stdio传输支持
WordPress MCP服务器,通过JSON-RPC 2.0协议与WordPress REST API交互,支持跨平台运行。
一个基于TypeScript的MCP服务器实现,通过直接调用Google Gemini API集成Gemini模型,支持最新Gemini 2.0 Flash模型并保持对话上下文。
Kernel MCP Server是一个基于Model Context Protocol (MCP)的开源服务器,为AI助手提供安全访问Kernel平台工具和浏览器自动化能力。它支持云端应用部署、无头浏览器控制、文档搜索等功能,采用OAuth 2.0认证确保安全。
一个基于OAuth 2.0认证的生产级Airtable MCP服务器,提供完整的Airtable API覆盖和标准化MCP接口,支持AI助手与Airtable交互。
一个基于Gemini Flash 2.0的命令行代码摘要工具,支持MCP服务器集成
增强版X平台MCP服务器,支持OAuth 2.0认证、媒体上传和API限流,提供发推、搜索、删推等功能。
通过标准OAuth 2.0流程授权访问Linear,并在MCP客户端上实现问题的创建、更新和列表功能
一个封装V2EX官方API 2.0的服务器,提供通知管理、用户信息、节点话题等接口功能,支持通过npm全局安装并配置token使用。
一个基于TypeScript的WordPress模型上下文协议(MCP)服务器,为AI系统提供标准化接口,通过JSON-RPC 2.0实现与WordPress站点的安全程序化交互。
一个用于WooCommerce集成的MCP服务器,支持Windows、macOS和Linux系统,提供全面的产品、订单、客户、运输、税务、折扣和商店配置管理工具,通过JSON-RPC 2.0协议与WordPress REST API交互。
一个基于JSON-RPC 2.0的跨平台笔记管理服务,支持命令行和后台服务两种运行模式,提供线程安全的笔记操作和摘要生成功能。
一个基于Elixir的MCP协议测试服务器实现,支持JSON-RPC 2.0标准,提供可插拔的验证中间件和模式驱动验证。
一个基于FastMCP框架的Google Ads API集成服务器,提供自动OAuth 2.0认证、GAQL查询和关键词研究功能,支持与Claude Desktop等MCP客户端无缝连接。