Figma推出AI图像编辑新功能,包括套索一键删除/隔离对象、背景自动扩边及无文本提示的光照/色彩调整。套索2.0支持选中目标后直接删除或拖移,背景保持不变。新工具将首先在Figma Design与Draw中上线,明年覆盖全平台。
Meta CEO扎克伯格亲自负责AI商业化,新一代大模型“Avocado”计划2026年春季发布,将仅提供API和托管服务,不再开源。该模型整合了谷歌、OpenAI及阿里等第三方开源技术,目标达到前沿性能。Meta已与英伟达签署50亿美元H100订单,专门用于模型训练。
“汉语盘点2025”活动公布年度候选字词前五名,国内字为“韧”“创”“融”“智”“通”,体现社会创新发展趋势。
苹果公司发布年度应用榜单,OpenAI的ChatGPT成为2025年美国市场免费iPhone应用下载冠军,标志着AI已深入日常生活。榜单显示,ChatGPT领先于Meta的Threads、Google搜索、TikTok等社交和实用工具应用。
Devstral 2开源编码模型及Mistral Vibe CLI,高效解决软件工程任务
一款将图像转化为 LoRA 模型的先进工具。
精准检测ChatGPT等多模型AI生成内容,支持20+语言,准确率超99.98%
拥有8000万住宅代理IP,可全球无缝采集数据,支持大规模提取。
Google
$0.49
输入tokens/百万
$2.1
输出tokens/百万
1k
上下文长度
$0.7
$2.8
Anthropic
$7
$35
200
$17.5
$21
$105
Alibaba
-
$2
$20
$8
$240
52
Moonshot
$4
$16
256
Bytedance
Tencent
$1
32
Baidu
Openai
$0.4
128
$0.75
64
mradermacher
这是一个专注于网络安全领域的20B参数开源大语言模型,基于GPT-OSS架构,并融合了多个网络安全指令数据集进行微调。模型提供了多种量化版本,便于在资源受限的环境中部署,可用于生成网络安全相关的文本、代码和分析报告。
bartowski
本项目是TheDrummer的Cydonia-24B-v4.3模型的量化版本,使用llama.cpp进行量化处理,旨在提供不同量化类型的模型文件,以满足不同硬件和性能需求。它是一个24B参数的大语言模型,主要用于文本生成任务。
MaziyarPanahi
这是NousResearch/Hermes-4.3-36B模型的GGUF量化格式版本,由MaziyarPanahi进行量化处理。GGUF是一种高效的模型格式,旨在优化本地部署和推理性能,支持多种量化级别(2位至8位),适用于广泛的文本生成任务。
open-thoughts
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
ai-sage
GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型,基于混合专家(MoE)架构,拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力(MLA)和多令牌预测(MTP)技术,旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练,支持包括中文在内的 10 种语言,适用于需要快速响应的对话场景。
DavidAU
Qwen3-4B-Hivemind-Instruct-NEO-MAX-Imatrix-GGUF 是一款基于 Qwen3 架构的 4B 参数指令微调大语言模型,采用 NEO Imatrix 与 MAX 量化技术,具备 256k 的超长上下文处理能力。该模型在多个基准测试中表现出色,是一款性能强劲的通用型模型。
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
Shawon16
这是一个基于VideoMAE-base架构微调的视频理解模型,专门针对手语识别任务进行优化。模型在WLASL数据集上训练了200个epoch,采用TimeSformer架构处理视频序列。
这是一个基于VideoMAE-base架构微调的视频理解模型,专门针对手语识别任务进行优化。模型在WLASL100数据集上训练了200个epoch,具备视频动作识别能力。
SerialKicked
这是Qwen3-VL-32B-Thinking-heretic的量化版本,采用新的消融方法进行量化,相比传统方法对基础模型的损害更小。提供多种量化精度版本,适合在24GB显存设备上运行,支持图文转文本任务。
这是一个基于VideoMAE-base架构在未知数据集上微调的视频理解模型,专门用于手语识别任务。模型在20个训练周期后达到了18.64%的准确率。
Clemylia
Gheya-1是LES-IA-ETOILES生态系统中的新一代基础语言模型,拥有2.02亿参数,是旧版Small-lamina系列的升级版本。该模型专为专业微调而设计,在人工智能、专业语言模型和生物学领域具有针对性训练。
这是一个基于VideoMAE-base架构的视频理解模型,在未知数据集上进行了20个epoch的微调训练。模型在评估集上表现有限,准确率为0.0041,损失值为7.7839。
gia-uh
塞西莉亚FT MS v1是基于塞西莉亚2B v0.1微调的古巴语言模型,专门针对古巴西班牙语进行优化,捕捉古巴语言、文化和社会的细微差别。该模型支持西班牙语和英语,主要用于文本生成任务。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基于Allen Institute for AI开发的Olmo-3-7B-Instruct模型的GGUF量化版本。这是一个70亿参数的自回归语言模型,通过监督微调和直接偏好优化在Tulu 2和UltraFeedback等数据集上训练,在问答和指令遵循方面表现出色。
这是基于MCG-NJU/videomae-base模型在未知数据集上微调的视频理解模型,经过20个epoch的训练,在评估集上达到13.31%的准确率。该模型专门针对视频分析任务进行优化。
vanta-research
Atom-Olmo3-7B是基于Olmo-3-7B-Instruct微调的语言模型,专门为协作式问题解决和创造性探索而设计。该模型在处理复杂问题时能提供深思熟虑且结构化的分析,同时保持引人入胜的对话风格,具有Apache 2.0开源许可证。
drbaph
这是一个基于Qwen Image Edit 2509的LoRA模型,专门用于将输入图像转换为带有夸张特征的素描漫画艺术作品。模型能够为人物和动物主体创作出幽默且富有艺术感的漫画形象,突出面部特征和特点。
Justin331
SAM 3 是 Meta 推出的第三代可提示分割基础模型,统一支持图像和视频分割任务。相比前代 SAM 2,它引入了开放词汇概念分割能力,能够处理大量文本提示,在 SA-CO 基准测试中达到人类表现的 75-80%。
RiosWesley
巴西范围路由模型是一个基于Gemma 3 270M的微调微型大语言模型,专为巴西外卖服务系统设计,可作为极快速且轻量级的意图分类器(路由)。该模型使用Unsloth进行训练并转换为GGUF格式。
Opik是一个开源的LLM评估框架,支持追踪、评估和监控LLM应用,帮助开发者构建更高效、更经济的LLM系统。
API 200是一个开源API集成平台,提供第三方API的快速接入和管理功能,包含自动生成代码、文档、认证、缓存和错误处理等特性,支持自托管部署和MCP服务。
这是一个实现MCP代码执行模式的服务器,通过单工具桥接和零上下文发现机制,将MCP工具调用开销从数万token降至约200token,并在根容器中安全执行Python代码,支持数据科学和安全隔离。
一个集成OpenAI Sora 2视频生成API的MCP服务器,提供视频生成、混剪、状态查询和自动下载功能
FreeCAD MCP是一个通过Claude Desktop控制FreeCAD的插件,支持从2D图纸创建3D模型等多种设计功能。
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用。项目提供CLI工具实现2分钟接入(当前支持Claude),并建立社区协作框架让开发者能轻松贡献和发布公开数据集。核心目标是构建连接所有LLM应用与数百万公开数据集的基础设施。
DBCode是一款VS Code数据库管理插件,支持20+种数据库连接,提供数据编辑、自然语言查询、ER图生成、可视化分析等功能,帮助开发者在IDE内高效完成数据库操作。
一个基于AWS Lambda、CloudFront和Cognito认证的无服务器MCP协议实现项目,提供完整的云端MCP服务器基础设施,支持OAuth 2.0认证、实时流传输和可扩展架构。
基于Gemini 2 API的图像生成MCP服务
MCP Probe Kit 是一个强大的开发工具集,提供23个实用工具,覆盖代码质量检测、开发效率提升和项目管理全流程,专为Cursor AI设计,帮助开发者提高开发效率和质量
MSSQL MCP服务器是一个增强型数据库管理工具,通过标准接口为语言模型提供全面的Microsoft SQL Server数据库访问能力,支持23种数据库操作工具,包括模式检查、查询执行、存储过程管理等高级功能。
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
一个基于Cline的Solana区块链数据查询服务,提供21种常用RPC方法,支持通过自然语言交互获取账户、区块、交易等链上信息。
该项目演示了如何使用OAuth 2.1授权流程和AWS Cognito保护MCP服务器,包含资源服务器、授权服务器、动态客户端注册等核心功能实现。
Gemini UI设计服务器是一个基于MCP协议的企业级UI/UX设计和前端实现专家系统,通过集成Google Gemini 2.5 PRO提供专业的UI组件设计、代码审查、前端代码生成和架构咨询服务
一个利用AI生成游戏资源的工具,支持2D和3D资源创建,集成Hugging Face和MCP协议。
基于Google Gemini 2.5 Flash API的MCP图像生成与编辑服务器,支持文本生成图像、图像编辑、迭代创作和风格迁移功能
一个通过JSON-RPC 2.0协议控制微软画图的服务器,支持启动画图程序、绘制图形、设置颜色和工具属性等功能。
一个基于Gemini Flash 2 AI模型的数据分析与研究MCP服务器,提供数据解析、智能分析、报告生成和邮件自动发送功能。
Titanmind WhatsApp MCP是一个基于Titanmind平台的WhatsApp营销和消息服务工具,提供对话管理、模板创建与批量发送等功能,支持24小时内自由格式消息和模板工作流自动处理。