OpenAI任命英国前财政大臣乔治·奥斯本负责其全球AI基础设施扩张计划,以应对日益激烈的AI地缘竞争。此举旨在加速推进价值5000亿美元的“星际之门”项目海外布局,紧随竞争对手Anthropic的扩张步伐。
OpenAI发布免费图像生成模型GPT Image 1.5,向所有用户开放。新模型实现四大升级:精准理解复杂指令、精细局部编辑、完整保留细节、提升图像一致性。
OpenAI宣布Apple Music将集成ChatGPT,用户可通过自然语言指令创建歌单。这一功能由OpenAI应用业务CEO菲吉·西莫透露,即将推出。此前ChatGPT已与Spotify、Booking.com等平台成功合作,此次集成将进一步扩展其应用场景。
OpenAI推出GPT Image1.5图像生成模型,旨在应对谷歌AI竞争。新模型在指令遵循、编辑控制和生成速度上均有显著提升,速度最高可达前代四倍。该模型已向ChatGPT及API用户开放,发布背景与OpenAI CEO提及的“红色警戒”状态相关。
基于OpenAI Sora 2的电商视频生成器,无水印,功能强大
统一AI API平台,超500模型,成本低速度快,OpenAI兼容
基于OpenAI Sora 2的AI视频生成器,可从文本或图像生成带声音的高清视频。
免费在线工具,可无质量损失地去除OpenAI Sora2视频水印
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
$7.7
$30.8
200
-
$0.4
128
$8.75
$70
400
$1.75
$14
$0.35
$0.63
$3.15
131
$17.5
$56
$0.7
Alibaba
$2
32
$525
$1050
Deepseek
8
$3.5
$10.5
16
$105
$420
Moonshot
$200
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基于 gpt-oss 构建的安全推理模型,拥有 1170 亿参数(其中 51 亿为活跃参数)。该模型专门针对安全用例设计,能够根据提供的安全策略对文本内容进行分类和执行基础安全任务。
adoamesh
本模型是基于OpenAI Whisper-small模型针对斯瓦希里语进行微调的自动语音识别模型。在FLEURS-SLU数据集的斯瓦希里语部分进行训练,显著提升了斯瓦希里语的转录准确率,单词错误率相比基础模型降低了68%。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微调版本,由 TheStage AI 针对多平台实时、低延迟和低功耗语音转文本推理进行优化。支持流式转录、单词时间戳和可扩展性能,适用于实时字幕、会议和设备端语音界面等场景。
TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微调版本,由TheStage AI针对多平台(NVIDIA GPU和Apple Silicon)的实时、低延迟和低功耗语音转文本推理进行了优化。
teckedd
本模型是基于OpenAI Whisper-small在Common Voice 17.0数据集上微调的自动语音识别模型,专门针对Twi语言进行优化,能够实现语音内容的准确识别。
SiddhJagani
这是OpenAI GPT-OSS-20B模型的MLX格式8位量化版本,使用mlx-lm 0.28.2转换,专为Apple Silicon优化,提供高效的文本生成能力
kalilouisangare
这是一个基于 OpenAI Whisper Small 模型微调的班巴拉语语音识别模型,在 24738 个班巴拉语音频样本上训练,能够将班巴拉语语音准确转录为文本,字符错误率低至 21.69%。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
Ken-Z
本模型是基于OpenAI Whisper-small在拉丁语上微调的自动语音识别模型,使用67小时拉丁语音频数据训练,字符错误率(CER)为20,支持拉丁语语音转文本任务。
ReportAId
MedWhisper Large ITA是基于OpenAI Whisper Large v3 Turbo的领域适配变体,专门针对意大利语医疗语音识别进行了优化。该模型在精心挑选的意大利语门诊专科就诊录音集上使用LoRA技术进行微调,显著提升了医学术语和临床表达的识别准确率。
openai
gpt-oss-safeguard-20b是基于gpt-oss构建的安全推理模型,拥有210亿参数(其中36亿为活跃参数),专门针对安全用例设计。该模型可根据提供的安全策略对文本内容进行分类,并执行基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
gpt-oss-safeguard-120b是基于gpt-oss构建的安全推理模型,专门为安全用例设计。该模型能够根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
feelmadrain
这是一个基于OpenAI Whisper Small架构的俄语自动语音识别模型,在Common Voice 17.0数据集上进行了专门训练,能够准确地将俄语语音转换为文本。
openchs
基于OpenAI Whisper Large v2在Common Voice 17.0斯瓦希里语数据集上微调的语音识别模型,专为坦桑尼亚儿童求助热线的斯瓦希里语语音识别任务设计,相比基础模型在斯瓦希里语识别准确率上有显著提升。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的开放权重模型,专为强大推理、智能体任务和多样化开发者用例设计。该模型具有210亿参数(其中36亿为活跃参数),采用混合专家架构,支持低延迟本地部署和特定场景应用。
2imi9
GPT-OSS-20B-NVFP4 是 OpenAI GPT-OSS-20B 模型的量化版本,采用 NVIDIA 先进的 NVFP4 量化格式。该模型在保持显著内存效率提升的同时,相比 MXFP4 量化能提供更出色的准确率保留率,专为高性能推理场景设计。
professorf
GPT-OSS-20B是OpenAI推出的开放权重模型,拥有210亿参数(其中36亿为活跃参数),专为低延迟、本地部署和特定用例设计。该模型基于harmony响应格式训练,具备强大的推理能力和智能体任务处理能力。
mlx-community
这是一个基于OpenAI GPT-OSS-120B模型转换而来的MLX格式版本,使用mlx-lm 0.27.0工具转换,支持高效的文本生成任务。
这是OpenAI GPT-OSS-20B模型的MLX格式转换版本,使用mlx-lm 0.27.0工具进行转换,支持在Apple Silicon设备上高效运行。模型采用MXFP4-Q8量化技术,在保持性能的同时显著减少内存占用。
这是一个基于OpenAI GPT-OSS-20B模型转换的MLX格式版本,使用mlx-lm 0.27.0工具进行转换,支持在Apple Silicon设备上高效运行。
Stripe Agent Toolkit是一个支持多种AI代理框架(如OpenAI、LangChain、CrewAI等)与Stripe API集成的工具包,提供Python和TypeScript支持,简化支付相关操作。
一个集成OpenAI Sora 2视频生成API的MCP服务器,提供视频生成、混剪、状态查询和自动下载功能
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
一个基于TypeScript的MCP服务器,可将Claude与任何兼容OpenAI SDK的聊天完成API集成,支持多种AI聊天提供商。
Codex Bridge是一个轻量级MCP服务器,通过官方CLI连接AI编程助手与OpenAI Codex,支持多客户端无API成本交互。
基于OpenAI Agents框架的智能聊天机器人,支持自定义工具扩展和Web交互。
该项目是一个基于LangChain的MCP客户端,用于演示如何通过LangChain ReAct Agent调用MCP服务器工具。它支持Anthropic、OpenAI和Groq的LLM,并提供了从MCP工具到LangChain工具的转换功能。
该项目实现了一个基于Model Context Protocol (MCP)的文档检索服务器,能够为AI助手动态获取Python库的最新官方文档内容。支持LangChain、LlamaIndex和OpenAI等库,通过SERPER API进行高效搜索,并使用BeautifulSoup解析HTML内容。项目设计可扩展,便于添加更多库的支持。
一个支持多LLM提供商的Python代码助手,具备实时可视化、成本管理和MCP服务器功能。
该项目是一个概念验证(POC),展示了如何通过自定义主机实现模型上下文协议(MCP),用于测试代理系统。核心功能包括OpenAI兼容API、Google Gemini集成、流式响应支持及工具调用能力。
openai-tool2mcp是一个开源桥梁工具,将OpenAI内置的高质量工具(如网页搜索、代码解释器等)封装为MCP协议服务器,使Claude等兼容MCP的模型也能使用这些强大功能。
一个使用OpenAI Agents库与MCP服务器交互的简单代理程序,支持计算数字和或讲笑话功能。
Nano Agent是一个实验性的小型工程代理MCP服务器,支持多提供商LLM模型,用于测试和比较云端与本地LLM在性能、速度和成本方面的代理能力。项目包含多模型评估系统、嵌套代理架构和统一工具接口,支持OpenAI、Anthropic和Ollama等提供商。
一个基于MCP协议的模板服务器,集成了OpenAI、Anthropic和EnrichB2B的API功能。
Azure OpenAI DALL-E 3集成服务器,通过MCP协议提供图像生成与下载功能
一个支持多LLM提供商并行查询的模型控制协议服务器,可同时调用OpenAI、Anthropic、Perplexity和Google的API进行交叉验证,提供统一接口并支持异步处理。
一个基于OpenAI DALL-E API的MCP服务器,提供图像生成、编辑和变体功能,支持与Cline集成。
一个基于FastAPI的MCP服务器,自动抓取、总结并推送Reddit内容到Slack。系统利用Azure OpenAI生成精选子版块帖子的摘要,整理为PDF报告并分享给团队。
一个基于MCP协议的语义代码搜索服务器,支持OpenAI和Ollama两种嵌入模型,能够索引本地项目或Git仓库,提供企业级的私有化代码搜索解决方案。
一个基于TypeScript的MCP服务器,使用OPENAI的dall-e-3模型根据文本提示生成图像,并支持将生成的图像保存到本地指定目录。