xAI发布Grok4.1,响应延迟降低42%,意图识别准确率提升18%,对话连贯性优化。基于Grok-4MoE架构,新增实时反馈层与个性化缓存,实现“秒回”体验。面向X Premium+用户无限使用,API定价维持每百万token 5美元。MT-Bench得分8.97,HumanEval代码生成通过率87.1%,多轮对话一致性达91.4%,刷新多项基准纪录。
Reverie公司发布新款语音转文本模型,支持印地语、英语及Hinglish混合语言,适应印度多语言环境。该模型已处理300万次API调用,在银行和呼叫中心等行业应用中展现出高精确度和快速响应能力。
百度推出“百度猎户座”AI引擎,首次全面开放其25年搜索技术与AI能力。该引擎整合搜索AI API、多模态计算平台及行业优势,为企业与开发者提供丰富工具资源,简化接入流程,实现原生能力调用,标志着百度AI技术应用的重要进展。
网信办持续推进生成式AI服务备案,新增73款完成备案。地方网信部门加强对已备案模型API调用的监管,旨在促进创新与规范应用。
Defapi是领先的AI模型API聚合平台,统一访问全球顶级AI模型。
提供语音、视频和聊天API,用于实时交互,加速应用增长。
快速实惠的搜索API,跨多搜索引擎,处理阻塞,提供JSON数据。
企业级 LLM 平台,提供统一 API 和智能路由。
tencent
$0.8
输入tokens/百万
$2
输出tokens/百万
32k
上下文长度
$3
$9
8k
openai
$3.6
$10.8
4.1k
moonshot
$0.5
-
shorecode
这是一个高效的文本摘要模型,专门设计用于压缩大语言模型提示中的文本内容,能够实现7倍以上的压缩率,显著降低API调用成本。
Roblox
RoGuard 1.0 是一款基于Llama-3.1-8B-Instruct微调的大语言模型,专注于提升文本生成API的安全性。
RoGuard 1.0 是一款基于 Llama-3.1-8B-Instruct 微调的先进大语言模型,专门用于为大语言模型提供安全保障。它能够在提示和回复两个层面进行安全分类,判断输入或输出是否违反安全政策,为文本生成API提供强大的安全护栏。
Roblox Guard 1.0是一款基于Llama-3.1-8B-Instruct微调的最先进指令微调大语言模型,专门设计用于保护文本生成API的安全。它能够在提示词和回复层面进行双级安全分类,有效审核用户查询和模型输出,确保内容符合安全政策。
stablediffusionapi
基于Stable Diffusion API的文本到图像生成模型,能够根据输入的文本描述生成超逼真的图像,适用于多种创意场景和艺术创作需求。
litert-community
这是Qwen2.5-0.5B-Instruct模型的LiteRT优化版本,专门针对移动设备部署进行了优化。该模型提供了多种量化变体,支持在Android设备上通过LiteRT框架和MediaPipe LLM推理API进行高效部署。
Salesforce
xLAM-2系列是基于APIGen-MT框架训练的大型动作模型,专注于多轮对话和函数调用能力,适用于AI代理开发。
基于DeepSeek-R1-Distill-Qwen-1.5B的多个变体,适配LiteRT框架和MediaPipe LLM推理API,可部署于Android平台。
xLAM-7b-fc-r 是 Salesforce 推出的一个针对函数调用优化的 7B 参数大型语言模型,能够根据输入查询和可用 API 提供快速、准确且结构化的响应。
apipack
基于CodeLlama-13b-hf架构微调的大语言模型,专门针对API调用生成任务优化
NexaAI
章鱼模型V2是一款20亿参数的开源语言模型,专为安卓API优化,采用功能令牌策略提升推理速度和准确性。
gorilla-llm
Gorilla OpenFunctions v2 是一个开源的大型语言模型,能够根据自然语言指令和API上下文生成可执行的API调用。
aligner
一个与模型无关的即插即用模块,适用于开源和基于API的模型,采用残差校正策略增强AI安全性
AlbedoBase XL 2.0 是一款文本到超逼真图像的生成模型,通过API实现高效图像转换,无需支付费用即可使用。
Gorilla OpenFunctions 扩展了大型语言模型的聊天完成功能,使其能够根据自然语言指令和 API 上下文生成可执行的 API 调用。
cooperleong00
基于DeBERTa-v3-large微调的毒性分类器,专门用于高效准确地评估文本毒性。该模型作为Perspective API的替代方案,在90k RTP样本上训练,在保留测试集上达到94.87%准确率和98.54% AUROC分数。
SDVN5-3DCuteWave API推理可助力实现文本到超逼真图像的转换,为用户带来高质量的图像生成体验。
squarelike
基于ShareGPT数据集和DeepL翻译API训练的韩英/英韩双向翻译模型
api19750904
一个基于PyTorch和HuggingPics构建的图像分类模型,专门用于食物分类
Apisate
DialoGPT 是微软发布的对话生成预训练模型,基于GPT架构,专为多轮对话任务设计。
Sail是一个旨在统一流处理、批处理和计算密集型(AI)工作负载的项目,提供了Spark SQL和Spark DataFrame API的替代方案,支持单机和分布式环境。
Exa MCP Server是一个为AI助手(如Claude)提供网络搜索功能的服务器,通过Exa AI搜索API实现实时、安全的网络信息获取。
该项目为Notion API实现了一个MCP服务器,允许通过模型上下文协议访问和操作Notion内容,支持搜索、评论、添加页面等功能。
Supabase MCP服务器是一个开源工具,允许IDE安全执行SQL、管理模式变更、调用Supabase管理API和使用Auth Admin SDK,内置安全控制。
该项目是一个MCP服务器,用于通过Obsidian的Local REST API插件与Obsidian笔记应用交互。它提供了多种工具来操作和管理Obsidian中的文件,包括列出文件、获取文件内容、搜索、修改内容和删除文件等。
PG-MCP是一个为PostgreSQL数据库设计的模型上下文协议服务器,提供AI代理发现、连接、查询和理解数据库的API,支持多数据库连接、丰富的目录信息和查询解释功能。
一个为Claude/Cursor设计的OpenAPI规范探索服务器,通过三步流程帮助用户搜索和理解API文档。
WhatsApp MCP服务器是一个通过WhatsApp网页多设备API连接个人账户的工具,支持消息搜索、发送及多媒体处理,并与Claude等LLM集成。
ElevenLabs官方MCP服务器,提供文本转语音和音频处理API交互能力
Stripe Agent Toolkit是一个支持多种AI代理框架(如OpenAI、LangChain、CrewAI等)与Stripe API集成的工具包,提供Python和TypeScript支持,简化支付相关操作。
该项目是一个集成Sonar API的MCP服务器实现,为Claude提供实时网络搜索能力。包含系统架构、工具配置、Docker部署及多平台集成指南。
Notion MCP Server是一个连接Notion API与LLM的中间件服务,通过Markdown转换优化交互效率。
MiniMax Model Context Protocol (MCP) 是一个官方服务器,支持与强大的文本转语音、视频/图像生成API交互,适用于多种客户端工具如Claude Desktop、Cursor等。
Framelink Figma MCP Server是一个为AI编程工具(如Cursor)提供Figma设计数据访问的服务器,通过简化Figma API响应,帮助AI更准确地实现设计到代码的一键转换。
百度地图MCP Server是国内首个兼容MCP协议的地图服务,提供地理编码、路线规划等10个标准化API接口,支持Python和Typescript快速接入,赋能智能体实现地图相关功能。
Anna's Archive的MCP服务器和CLI工具,用于搜索和下载该平台的文档,支持通过API密钥访问。
MCP Link是一个自动化工具,能够将任何OpenAPI V3规范的API转换为MCP服务器,使现有RESTful API能够无缝接入AI驱动的应用生态系统。
一个基于Python的MCP服务器,通过Notion API提供高级待办事项管理和内容组织功能,实现AI模型与Notion的无缝集成。
一个基于Model Context Protocol (MCP)的B站视频搜索服务器,提供API接口支持视频内容搜索、分页查询及视频信息返回,包含LangChain调用示例和测试脚本。
一个用于与LogSeq笔记应用交互的MCP服务器,提供多种API工具操作笔记内容。