Harness完成2.4亿美元E轮融资,由高盛领投,估值达55亿美元。资金将重点用于发展其AI平台,旨在通过集成智能代理和上下文感知技术,优化软件交付流程,消除后期编码瓶颈。
欧洲AI公司Mistral AI发布新一代开源编码模型家族Devstral2,包括123B参数旗舰版和24B轻量版,并推出配套命令行工具Mistral Vibe CLI,支持自动化编程。该模型在SWE-bench基准测试中获72.2分,接近顶级闭源模型性能,且API目前免费开放,为开发者提供强大助力。
京东正招聘端侧AI芯片人才,专注存算一体芯片开发,旨在为机器人和智能家电等硬件产品提供AI芯片支持,推动产品智能化升级。招聘岗位薪资优厚,最高年薪可达“40-100K*20”。
时代杂志将“人工智能的建筑师”评为2025年度人物,这是该奖项第二次授予科技领域而非个人,凸显AI在全球产业与公共生活中的关键作用。杂志发布两款封面:一款以AI字母构成建设中的纪念碑,另一款则重新演绎《午餐在摩天大楼》画面,展现技术领袖形象。
Alibaba的Wan 2.6可从文本或图像创建音频同步的1080p AI视频
VidMix AI结合Sora 2、Veo 3等技术,可快速将文本和图像转为专业视频。
Devstral 2开源编码模型及Mistral Vibe CLI,高效解决软件工程任务
一款将图像转化为 LoRA 模型的先进工具。
Google
$0.49
输入tokens/百万
$2.1
输出tokens/百万
1k
上下文长度
$0.7
$2.8
Anthropic
$7
$35
200
$17.5
$21
$105
Alibaba
-
$2
$20
$8
$240
52
Moonshot
$4
$16
256
Bytedance
Tencent
$1
32
Baidu
Openai
$0.4
128
$0.75
64
mradermacher
这是一个专注于网络安全领域的20B参数开源大语言模型,基于GPT-OSS架构,并融合了多个网络安全指令数据集进行微调。模型提供了多种量化版本,便于在资源受限的环境中部署,可用于生成网络安全相关的文本、代码和分析报告。
bartowski
本项目是TheDrummer的Cydonia-24B-v4.3模型的量化版本,使用llama.cpp进行量化处理,旨在提供不同量化类型的模型文件,以满足不同硬件和性能需求。它是一个24B参数的大语言模型,主要用于文本生成任务。
MaziyarPanahi
这是NousResearch/Hermes-4.3-36B模型的GGUF量化格式版本,由MaziyarPanahi进行量化处理。GGUF是一种高效的模型格式,旨在优化本地部署和推理性能,支持多种量化级别(2位至8位),适用于广泛的文本生成任务。
open-thoughts
OpenThinker-Agent-v1 是一个基于 Qwen3-8B 进行后续训练的开源智能体模型,专为终端操作和软件工程任务而设计。它首先在高质量监督微调数据集上进行训练,然后通过强化学习进一步优化,在 Terminal-Bench 2.0 和 SWE-Bench 等智能体基准测试中表现出色。
ai-sage
GigaChat3-10B-A1.8B 是 GigaChat 系列的高效对话模型,基于混合专家(MoE)架构,拥有 100 亿总参数和 18 亿活跃参数。它采用了创新的多头潜在注意力(MLA)和多令牌预测(MTP)技术,旨在优化推理吞吐量和生成速度。模型在 20T 令牌的多样化数据上训练,支持包括中文在内的 10 种语言,适用于需要快速响应的对话场景。
DavidAU
Qwen3-4B-Hivemind-Instruct-NEO-MAX-Imatrix-GGUF 是一款基于 Qwen3 架构的 4B 参数指令微调大语言模型,采用 NEO Imatrix 与 MAX 量化技术,具备 256k 的超长上下文处理能力。该模型在多个基准测试中表现出色,是一款性能强劲的通用型模型。
这是由Mistral AI开发的大型语言模型Mistral-Large-3-675B-Instruct-2512的GGUF量化版本。原始模型拥有6750亿参数,专为指令遵循任务设计。本项目使用llama.cpp工具,结合imatrix校准数据集,生成了从Q8_0到IQ1_S共20多种不同精度的量化模型文件,旨在平衡模型性能、推理速度与存储/内存占用,使其能在更广泛的硬件上运行。
Shawon16
这是一个基于VideoMAE-base架构微调的视频理解模型,专门针对手语识别任务进行优化。模型在WLASL数据集上训练了200个epoch,采用TimeSformer架构处理视频序列。
这是一个基于VideoMAE-base架构微调的视频理解模型,专门针对手语识别任务进行优化。模型在WLASL100数据集上训练了200个epoch,具备视频动作识别能力。
SerialKicked
这是Qwen3-VL-32B-Thinking-heretic的量化版本,采用新的消融方法进行量化,相比传统方法对基础模型的损害更小。提供多种量化精度版本,适合在24GB显存设备上运行,支持图文转文本任务。
这是一个基于VideoMAE-base架构在未知数据集上微调的视频理解模型,专门用于手语识别任务。模型在20个训练周期后达到了18.64%的准确率。
Clemylia
Gheya-1是LES-IA-ETOILES生态系统中的新一代基础语言模型,拥有2.02亿参数,是旧版Small-lamina系列的升级版本。该模型专为专业微调而设计,在人工智能、专业语言模型和生物学领域具有针对性训练。
这是一个基于VideoMAE-base架构的视频理解模型,在未知数据集上进行了20个epoch的微调训练。模型在评估集上表现有限,准确率为0.0041,损失值为7.7839。
gia-uh
塞西莉亚FT MS v1是基于塞西莉亚2B v0.1微调的古巴语言模型,专门针对古巴西班牙语进行优化,捕捉古巴语言、文化和社会的细微差别。该模型支持西班牙语和英语,主要用于文本生成任务。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基于Allen Institute for AI开发的Olmo-3-7B-Instruct模型的GGUF量化版本。这是一个70亿参数的自回归语言模型,通过监督微调和直接偏好优化在Tulu 2和UltraFeedback等数据集上训练,在问答和指令遵循方面表现出色。
这是基于MCG-NJU/videomae-base模型在未知数据集上微调的视频理解模型,经过20个epoch的训练,在评估集上达到13.31%的准确率。该模型专门针对视频分析任务进行优化。
vanta-research
Atom-Olmo3-7B是基于Olmo-3-7B-Instruct微调的语言模型,专门为协作式问题解决和创造性探索而设计。该模型在处理复杂问题时能提供深思熟虑且结构化的分析,同时保持引人入胜的对话风格,具有Apache 2.0开源许可证。
drbaph
这是一个基于Qwen Image Edit 2509的LoRA模型,专门用于将输入图像转换为带有夸张特征的素描漫画艺术作品。模型能够为人物和动物主体创作出幽默且富有艺术感的漫画形象,突出面部特征和特点。
Justin331
SAM 3 是 Meta 推出的第三代可提示分割基础模型,统一支持图像和视频分割任务。相比前代 SAM 2,它引入了开放词汇概念分割能力,能够处理大量文本提示,在 SA-CO 基准测试中达到人类表现的 75-80%。
RiosWesley
巴西范围路由模型是一个基于Gemma 3 270M的微调微型大语言模型,专为巴西外卖服务系统设计,可作为极快速且轻量级的意图分类器(路由)。该模型使用Unsloth进行训练并转换为GGUF格式。
Opik是一个开源的LLM评估框架,支持追踪、评估和监控LLM应用,帮助开发者构建更高效、更经济的LLM系统。
MaverickMCP是一个基于FastMCP 2.0的个人股票分析服务器,为Claude Desktop等MCP客户端提供专业级的金融数据分析、技术指标计算和投资组合优化工具。它预置了520只标普500股票数据,支持多种技术分析策略和并行处理,无需复杂认证即可本地运行。
API 200是一个开源API集成平台,提供第三方API的快速接入和管理功能,包含自动生成代码、文档、认证、缓存和错误处理等特性,支持自托管部署和MCP服务。
这是一个实现MCP代码执行模式的服务器,通过单工具桥接和零上下文发现机制,将MCP工具调用开销从数万token降至约200token,并在根容器中安全执行Python代码,支持数据科学和安全隔离。
一个集成OpenAI Sora 2视频生成API的MCP服务器,提供视频生成、混剪、状态查询和自动下载功能
FreeCAD MCP是一个通过Claude Desktop控制FreeCAD的插件,支持从2D图纸创建3D模型等多种设计功能。
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用。项目提供CLI工具实现2分钟接入(当前支持Claude),并建立社区协作框架让开发者能轻松贡献和发布公开数据集。核心目标是构建连接所有LLM应用与数百万公开数据集的基础设施。
DBCode是一款VS Code数据库管理插件,支持20+种数据库连接,提供数据编辑、自然语言查询、ER图生成、可视化分析等功能,帮助开发者在IDE内高效完成数据库操作。
一个基于AWS Lambda、CloudFront和Cognito认证的无服务器MCP协议实现项目,提供完整的云端MCP服务器基础设施,支持OAuth 2.0认证、实时流传输和可扩展架构。
基于Gemini 2 API的图像生成MCP服务
MSSQL MCP服务器是一个增强型数据库管理工具,通过标准接口为语言模型提供全面的Microsoft SQL Server数据库访问能力,支持23种数据库操作工具,包括模式检查、查询执行、存储过程管理等高级功能。
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
一个基于Cline的Solana区块链数据查询服务,提供21种常用RPC方法,支持通过自然语言交互获取账户、区块、交易等链上信息。
MCP Probe Kit 是一个强大的开发工具集,提供23个实用工具,覆盖代码质量检测、开发效率提升和项目管理全流程,专为Cursor AI设计,帮助开发者提高开发效率和质量
该项目演示了如何使用OAuth 2.1授权流程和AWS Cognito保护MCP服务器,包含资源服务器、授权服务器、动态客户端注册等核心功能实现。
一个基于Gemini Flash 2 AI模型的数据分析与研究MCP服务器,提供数据解析、智能分析、报告生成和邮件自动发送功能。
Titanmind WhatsApp MCP是一个基于Titanmind平台的WhatsApp营销和消息服务工具,提供对话管理、模板创建与批量发送等功能,支持24小时内自由格式消息和模板工作流自动处理。
一个利用AI生成游戏资源的工具,支持2D和3D资源创建,集成Hugging Face和MCP协议。
一个用Scala 3编写的MCP协议服务器,支持多种工具功能。
Gemini UI设计服务器是一个基于MCP协议的企业级UI/UX设计和前端实现专家系统,通过集成Google Gemini 2.5 PRO提供专业的UI组件设计、代码审查、前端代码生成和架构咨询服务