Adobe与OpenAI合作,将Photoshop和Adobe Express接入ChatGPT生态。用户可通过自然语言在ChatGPT中直接编辑图片,简化操作流程,扩展AI创意工具应用。合作提升用户体验,推动技术整合。
前OpenAI首席技术官Mira Murati领导的团队推出“在线策略蒸馏”技术,仅用80亿参数的小模型即可达到32B大模型70%的性能,训练成本降低90%,效率提升50-100倍,让中小企业和个人开发者能以低成本获得高性能模型。
OpenAI宣布Sora应用在美、加、日、韩取消邀请码限制,用户可直接登录。此举推动AI创意工具普及,标志从封闭测试转向广泛开放。Sora基于Sora2模型,支持文本或图片生成高质量带音频短视频,加速全球推广。
OpenAI因视频生成应用Sora使用“Cameo”功能名称遭起诉。原告Cameo公司指控其商标侵权,称该功能允许用户添加名人影像,与自家注册商标高度相似,易致消费者混淆并损害品牌价值。诉状强调此举可能造成不可弥补损失。
免费在线工具,可无质量损失地去除OpenAI Sora2视频水印
Soro 2是由OpenAI Sora 2 API驱动的前沿AI视频创作套件。
由OpenAI Sora 2驱动的AI视频生成平台,可创建高质量视频。
免费在线使用OpenAI Sora 2生成动漫、电影及逼真视频,无需邀请码
openai
$144
输入tokens/百万
$576
输出tokens/百万
200k
上下文长度
$14.4
$57.6
$7.92
$31.68
$9
$72
400k
-
$21.6
$86.4
128k
$540
$1080
1M
$1.08
$4.32
$3.6
$10.8
4.1k
$1.8
131.1k
teckedd
本模型是基于OpenAI Whisper-small在Common Voice 17.0数据集上微调的自动语音识别模型,专门针对Twi语言进行优化,能够实现语音内容的准确识别。
kalilouisangare
这是一个基于 OpenAI Whisper Small 模型微调的班巴拉语语音识别模型,在 24738 个班巴拉语音频样本上训练,能够将班巴拉语语音准确转录为文本,字符错误率低至 21.69%。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
Ken-Z
本模型是基于OpenAI Whisper-small在拉丁语上微调的自动语音识别模型,使用67小时拉丁语音频数据训练,字符错误率(CER)为20,支持拉丁语语音转文本任务。
ReportAId
MedWhisper Large ITA是基于OpenAI Whisper Large v3 Turbo的领域适配变体,专门针对意大利语医疗语音识别进行了优化。该模型在精心挑选的意大利语门诊专科就诊录音集上使用LoRA技术进行微调,显著提升了医学术语和临床表达的识别准确率。
feelmadrain
这是一个基于OpenAI Whisper Small架构的俄语自动语音识别模型,在Common Voice 17.0数据集上进行了专门训练,能够准确地将俄语语音转换为文本。
openchs
基于OpenAI Whisper Large v2在Common Voice 17.0斯瓦希里语数据集上微调的语音识别模型,专为坦桑尼亚儿童求助热线的斯瓦希里语语音识别任务设计,相比基础模型在斯瓦希里语识别准确率上有显著提升。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的开放权重模型,专为强大推理、智能体任务和多样化开发者用例设计。该模型具有210亿参数(其中36亿为活跃参数),采用混合专家架构,支持低延迟本地部署和特定场景应用。
2imi9
GPT-OSS-20B-NVFP4 是 OpenAI GPT-OSS-20B 模型的量化版本,采用 NVIDIA 先进的 NVFP4 量化格式。该模型在保持显著内存效率提升的同时,相比 MXFP4 量化能提供更出色的准确率保留率,专为高性能推理场景设计。
professorf
GPT-OSS-20B是OpenAI推出的开放权重模型,拥有210亿参数(其中36亿为活跃参数),专为低延迟、本地部署和特定用例设计。该模型基于harmony响应格式训练,具备强大的推理能力和智能体任务处理能力。
mlx-community
这是一个基于OpenAI GPT-OSS-120B模型转换而来的MLX格式版本,使用mlx-lm 0.27.0工具转换,支持高效的文本生成任务。
这是OpenAI GPT-OSS-20B模型的MLX格式转换版本,使用mlx-lm 0.27.0工具进行转换,支持在Apple Silicon设备上高效运行。模型采用MXFP4-Q8量化技术,在保持性能的同时显著减少内存占用。
这是一个基于OpenAI GPT-OSS-20B模型转换的MLX格式版本,使用mlx-lm 0.27.0工具进行转换,支持在Apple Silicon设备上高效运行。
arunimas1107
这是一个基于openai/gpt-oss-20b进行医疗领域微调的LoRA适配器模型,专门针对医疗问答、摘要生成和知识检索等任务进行了优化。该模型通过高效的参数微调技术保留了基础200亿参数模型的通用推理能力,同时增强了在医疗领域的表现。
tiantiaf
基于openai/whisper-small优化的印度多语言分类模型,支持23种印度地区语言的精准识别,为语言识别领域提供高效解决方案。
0xShonen
GPT-OSS-20B是OpenAI发布的开放权重模型,专为强大的推理、智能体任务和多样化开发者用例设计。该模型具有21B参数(其中3.6B为活跃参数),支持低延迟推理和本地部署,采用Apache 2.0许可证,可自由用于实验、定制和商业部署。
giladgd
GPT-OSS-120b-GGUF 是 OpenAI 发布的 1200 亿参数开源文本生成模型,采用 Apache 2.0 宽松许可证,支持灵活的推理强度配置和完整思维链访问,具备原生函数调用、网页浏览和代码执行能力。
GPT-OSS-20b-GGUF 是一个基于 OpenAI GPT-OSS-20b 模型的量化版本,采用 Apache 2.0 许可协议,具有宽松的使用条款。该模型支持文本生成任务,具备完整的思维链推理能力,并经过原生 MXFP4 量化,可在不同内存条件下高效运行。
bartowski
OpenAI GPT-OSS-120B模型的量化版本,使用llama.cpp工具和imatrix数据集进行量化处理,提供多种量化级别以适应不同硬件需求,支持在LM Studio和llama.cpp环境中运行。
NexaAI
基于OpenAI Whisper架构微调的自动语音识别和语音翻译模型,通过减少解码层数量实现显著速度提升,同时保持接近原版的识别质量。
Stripe Agent Toolkit是一个支持多种AI代理框架(如OpenAI、LangChain、CrewAI等)与Stripe API集成的工具包,提供Python和TypeScript支持,简化支付相关操作。
一个集成OpenAI Sora 2视频生成API的MCP服务器,提供视频生成、混剪、状态查询和自动下载功能
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
一个基于TypeScript的MCP服务器,可将Claude与任何兼容OpenAI SDK的聊天完成API集成,支持多种AI聊天提供商。
基于OpenAI Agents框架的智能聊天机器人,支持自定义工具扩展和Web交互。
一个支持多LLM提供商的Python代码助手,具备实时可视化、成本管理和MCP服务器功能。
Codex Bridge是一个轻量级MCP服务器,通过官方CLI连接AI编程助手与OpenAI Codex,支持多客户端无API成本交互。
一个使用OpenAI Agents库与MCP服务器交互的简单代理程序,支持计算数字和或讲笑话功能。
openai-tool2mcp是一个开源桥梁工具,将OpenAI内置的高质量工具(如网页搜索、代码解释器等)封装为MCP协议服务器,使Claude等兼容MCP的模型也能使用这些强大功能。
该项目是一个概念验证(POC),展示了如何通过自定义主机实现模型上下文协议(MCP),用于测试代理系统。核心功能包括OpenAI兼容API、Google Gemini集成、流式响应支持及工具调用能力。
Nano Agent是一个实验性的小型工程代理MCP服务器,支持多提供商LLM模型,用于测试和比较云端与本地LLM在性能、速度和成本方面的代理能力。项目包含多模型评估系统、嵌套代理架构和统一工具接口,支持OpenAI、Anthropic和Ollama等提供商。
该项目是一个基于LangChain的MCP客户端,用于演示如何通过LangChain ReAct Agent调用MCP服务器工具。它支持Anthropic、OpenAI和Groq的LLM,并提供了从MCP工具到LangChain工具的转换功能。
该项目实现了一个基于Model Context Protocol (MCP)的文档检索服务器,能够为AI助手动态获取Python库的最新官方文档内容。支持LangChain、LlamaIndex和OpenAI等库,通过SERPER API进行高效搜索,并使用BeautifulSoup解析HTML内容。项目设计可扩展,便于添加更多库的支持。
一个基于MCP协议的模板服务器,集成了OpenAI、Anthropic和EnrichB2B的API功能。
一个基于FastAPI的MCP服务器,自动抓取、总结并推送Reddit内容到Slack。系统利用Azure OpenAI生成精选子版块帖子的摘要,整理为PDF报告并分享给团队。
一个支持多LLM提供商并行查询的模型控制协议服务器,可同时调用OpenAI、Anthropic、Perplexity和Google的API进行交叉验证,提供统一接口并支持异步处理。
一个基于OpenAI DALL-E API的MCP服务器,提供图像生成、编辑和变体功能,支持与Cline集成。
Azure OpenAI DALL-E 3集成服务器,通过MCP协议提供图像生成与下载功能
一个基于MCP协议的语义代码搜索服务器,支持OpenAI和Ollama两种嵌入模型,能够索引本地项目或Git仓库,提供企业级的私有化代码搜索解决方案。
JSON Resume MCP Server是一个AI驱动的工具,通过分析用户的代码项目自动更新JSON简历,支持GitHub集成和OpenAI生成专业描述。