谷歌正与AI初创公司Anthropic洽谈增资,若成功其估值或超3500亿美元。Anthropic由前OpenAI团队创立,以Claude语言模型闻名,此前已获谷歌超30亿美元投资。
OpenAI宣布全球企业客户突破100万家,使用席位达700万,显示AI技术在商业领域快速普及。客户包括付费组织及通过开发者平台直接使用AI模型的企业,体现企业对前沿技术的积极采纳。
OpenAI首席财务官萨拉·弗莱尔表示,公司目前不考虑IPO,首要任务是推动增长与研发,而非追求盈利。她强调公司正进行结构性转型以适应规模,但上市并非当前目标。
软银与OpenAI合资成立SB OAI Japan,各持股50%,旨在将OpenAI企业级AI技术引入日本市场。公司将推出企业AI解决方案“Crystal intelligence”,推动本地化应用,深化双方在人工智能领域的合作。
免费在线工具,可无质量损失地去除OpenAI Sora2视频水印
Soro 2是由OpenAI Sora 2 API驱动的前沿AI视频创作套件。
由OpenAI Sora 2驱动的AI视频生成平台,可创建高质量视频。
免费在线使用OpenAI Sora 2生成动漫、电影及逼真视频,无需邀请码
openai
$144
输入tokens/百万
$576
输出tokens/百万
200k
上下文长度
$14.4
$57.6
$7.92
$31.68
$9
$72
400k
-
$21.6
$86.4
128k
$540
$1080
1M
$1.08
$4.32
$3.6
$10.8
4.1k
$1.8
131.1k
unsloth
gpt-oss-safeguard-120b 是 OpenAI 基于 gpt-oss 构建的安全推理模型,拥有 1170 亿参数(其中 51 亿为活跃参数)。该模型专门针对安全用例设计,能够根据提供的安全策略对文本内容进行分类和执行基础安全任务。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微调版本,由 TheStage AI 针对多平台实时、低延迟和低功耗语音转文本推理进行优化。支持流式转录、单词时间戳和可扩展性能,适用于实时字幕、会议和设备端语音界面等场景。
TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微调版本,由TheStage AI针对多平台(NVIDIA GPU和Apple Silicon)的实时、低延迟和低功耗语音转文本推理进行了优化。
teckedd
本模型是基于OpenAI Whisper-small在Common Voice 17.0数据集上微调的自动语音识别模型,专门针对Twi语言进行优化,能够实现语音内容的准确识别。
kalilouisangare
这是一个基于 OpenAI Whisper Small 模型微调的班巴拉语语音识别模型,在 24738 个班巴拉语音频样本上训练,能够将班巴拉语语音准确转录为文本,字符错误率低至 21.69%。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基于OpenAI gpt-oss-120b模型的优化版本,采用混合专家(MoE)架构,具备1200亿总参数和50亿激活参数。该模型支持商业和非商业使用,适用于文本生成任务,特别适合AI Agent系统、聊天机器人等应用开发。
Ken-Z
本模型是基于OpenAI Whisper-small在拉丁语上微调的自动语音识别模型,使用67小时拉丁语音频数据训练,字符错误率(CER)为20,支持拉丁语语音转文本任务。
ReportAId
MedWhisper Large ITA是基于OpenAI Whisper Large v3 Turbo的领域适配变体,专门针对意大利语医疗语音识别进行了优化。该模型在精心挑选的意大利语门诊专科就诊录音集上使用LoRA技术进行微调,显著提升了医学术语和临床表达的识别准确率。
gpt-oss-safeguard-20b是基于gpt-oss构建的安全推理模型,拥有210亿参数(其中36亿为活跃参数),专门针对安全用例设计。该模型可根据提供的安全策略对文本内容进行分类,并执行基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
gpt-oss-safeguard-120b是基于gpt-oss构建的安全推理模型,专门为安全用例设计。该模型能够根据提供的安全策略对文本内容进行分类,并执行一系列基础安全任务,适用于大语言模型输入输出过滤、在线内容标注等场景。
feelmadrain
这是一个基于OpenAI Whisper Small架构的俄语自动语音识别模型,在Common Voice 17.0数据集上进行了专门训练,能够准确地将俄语语音转换为文本。
openchs
基于OpenAI Whisper Large v2在Common Voice 17.0斯瓦希里语数据集上微调的语音识别模型,专为坦桑尼亚儿童求助热线的斯瓦希里语语音识别任务设计,相比基础模型在斯瓦希里语识别准确率上有显著提升。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的开放权重模型,专为强大推理、智能体任务和多样化开发者用例设计。该模型具有210亿参数(其中36亿为活跃参数),采用混合专家架构,支持低延迟本地部署和特定场景应用。
2imi9
GPT-OSS-20B-NVFP4 是 OpenAI GPT-OSS-20B 模型的量化版本,采用 NVIDIA 先进的 NVFP4 量化格式。该模型在保持显著内存效率提升的同时,相比 MXFP4 量化能提供更出色的准确率保留率,专为高性能推理场景设计。
professorf
GPT-OSS-20B是OpenAI推出的开放权重模型,拥有210亿参数(其中36亿为活跃参数),专为低延迟、本地部署和特定用例设计。该模型基于harmony响应格式训练,具备强大的推理能力和智能体任务处理能力。
mlx-community
这是一个基于OpenAI GPT-OSS-120B模型转换而来的MLX格式版本,使用mlx-lm 0.27.0工具转换,支持高效的文本生成任务。
这是OpenAI GPT-OSS-20B模型的MLX格式转换版本,使用mlx-lm 0.27.0工具进行转换,支持在Apple Silicon设备上高效运行。模型采用MXFP4-Q8量化技术,在保持性能的同时显著减少内存占用。
这是一个基于OpenAI GPT-OSS-20B模型转换的MLX格式版本,使用mlx-lm 0.27.0工具进行转换,支持在Apple Silicon设备上高效运行。
jacktol
基于OpenAI Whisper Large v3模型微调的航空交通管制语音识别模型,专门针对ATC通信场景优化,在测试集上实现了6.5%的字错误率,显著提升了航空通信转录的准确性。
arunimas1107
这是一个基于openai/gpt-oss-20b进行医疗领域微调的LoRA适配器模型,专门针对医疗问答、摘要生成和知识检索等任务进行了优化。该模型通过高效的参数微调技术保留了基础200亿参数模型的通用推理能力,同时增强了在医疗领域的表现。
Stripe Agent Toolkit是一个支持多种AI代理框架(如OpenAI、LangChain、CrewAI等)与Stripe API集成的工具包,提供Python和TypeScript支持,简化支付相关操作。
一个集成OpenAI Sora 2视频生成API的MCP服务器,提供视频生成、混剪、状态查询和自动下载功能
Unreal Engine生成式AI支持插件,集成多种前沿LLM/GenAI模型API,提供游戏开发中的AI集成层支持,包括OpenAI、Claude、Deepseek等模型的聊天、结构化输出等功能,并支持Model Control Protocol(MCP)实现场景对象控制、蓝图生成等高级功能。
一个基于TypeScript的MCP服务器,可将Claude与任何兼容OpenAI SDK的聊天完成API集成,支持多种AI聊天提供商。
该项目是一个基于LangChain的MCP客户端,用于演示如何通过LangChain ReAct Agent调用MCP服务器工具。它支持Anthropic、OpenAI和Groq的LLM,并提供了从MCP工具到LangChain工具的转换功能。
Codex Bridge是一个轻量级MCP服务器,通过官方CLI连接AI编程助手与OpenAI Codex,支持多客户端无API成本交互。
该项目是一个概念验证(POC),展示了如何通过自定义主机实现模型上下文协议(MCP),用于测试代理系统。核心功能包括OpenAI兼容API、Google Gemini集成、流式响应支持及工具调用能力。
Nano Agent是一个实验性的小型工程代理MCP服务器,支持多提供商LLM模型,用于测试和比较云端与本地LLM在性能、速度和成本方面的代理能力。项目包含多模型评估系统、嵌套代理架构和统一工具接口,支持OpenAI、Anthropic和Ollama等提供商。
基于OpenAI Agents框架的智能聊天机器人,支持自定义工具扩展和Web交互。
openai-tool2mcp是一个开源桥梁工具,将OpenAI内置的高质量工具(如网页搜索、代码解释器等)封装为MCP协议服务器,使Claude等兼容MCP的模型也能使用这些强大功能。
一个支持多LLM提供商的Python代码助手,具备实时可视化、成本管理和MCP服务器功能。
一个使用OpenAI Agents库与MCP服务器交互的简单代理程序,支持计算数字和或讲笑话功能。
该项目实现了一个基于Model Context Protocol (MCP)的文档检索服务器,能够为AI助手动态获取Python库的最新官方文档内容。支持LangChain、LlamaIndex和OpenAI等库,通过SERPER API进行高效搜索,并使用BeautifulSoup解析HTML内容。项目设计可扩展,便于添加更多库的支持。
一个基于MCP协议的语义代码搜索服务器,支持OpenAI和Ollama两种嵌入模型,能够索引本地项目或Git仓库,提供企业级的私有化代码搜索解决方案。
一个基于OpenAI DALL-E API的MCP服务器,提供图像生成、编辑和变体功能,支持与Cline集成。
一个支持多LLM提供商并行查询的模型控制协议服务器,可同时调用OpenAI、Anthropic、Perplexity和Google的API进行交叉验证,提供统一接口并支持异步处理。
Azure OpenAI DALL-E 3集成服务器,通过MCP协议提供图像生成与下载功能
一个基于MCP协议的模板服务器,集成了OpenAI、Anthropic和EnrichB2B的API功能。
一个基于FastAPI的MCP服务器,自动抓取、总结并推送Reddit内容到Slack。系统利用Azure OpenAI生成精选子版块帖子的摘要,整理为PDF报告并分享给团队。
一个基于TypeScript的MCP服务器,使用OPENAI的dall-e-3模型根据文本提示生成图像,并支持将生成的图像保存到本地指定目录。