Adobe與OpenAI合作,將Photoshop和Adobe Express接入ChatGPT生態。用戶可通過自然語言在ChatGPT中直接編輯圖片,簡化操作流程,擴展AI創意工具應用。合作提升用戶體驗,推動技術整合。
前OpenAI首席技術官Mira Murati領導的團隊推出“在線策略蒸餾”技術,僅用80億參數的小模型即可達到32B大模型70%的性能,訓練成本降低90%,效率提升50-100倍,讓中小企業和個人開發者能以低成本獲得高性能模型。
OpenAI宣佈Sora應用在美、加、日、韓取消邀請碼限制,用戶可直接登錄。此舉推動AI創意工具普及,標誌從封閉測試轉向廣泛開放。Sora基於Sora2模型,支持文本或圖片生成高質量帶音頻短視頻,加速全球推廣。
OpenAI因視頻生成應用Sora使用“Cameo”功能名稱遭起訴。原告Cameo公司指控其商標侵權,稱該功能允許用戶添加名人影像,與自家註冊商標高度相似,易致消費者混淆並損害品牌價值。訴狀強調此舉可能造成不可彌補損失。
免費在線工具,可無質量損失地去除OpenAI Sora2視頻水印
Soro 2是由OpenAI Sora 2 API驅動的前沿AI視頻創作套件。
由OpenAI Sora 2驅動的AI視頻生成平臺,可創建高質量視頻。
免費在線使用OpenAI Sora 2生成動漫、電影及逼真視頻,無需邀請碼
openai
$144
輸入tokens/百萬
$576
輸出tokens/百萬
200k
上下文長度
$14.4
$57.6
$7.92
$31.68
$9
$72
400k
-
$21.6
$86.4
128k
$540
$1080
1M
$1.08
$4.32
$3.6
$10.8
4.1k
$1.8
131.1k
teckedd
本模型是基於OpenAI Whisper-small在Common Voice 17.0數據集上微調的自動語音識別模型,專門針對Twi語言進行優化,能夠實現語音內容的準確識別。
kalilouisangare
這是一個基於 OpenAI Whisper Small 模型微調的班巴拉語語音識別模型,在 24738 個班巴拉語音頻樣本上訓練,能夠將班巴拉語語音準確轉錄為文本,字符錯誤率低至 21.69%。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基於OpenAI gpt-oss-120b模型的優化版本,採用混合專家(MoE)架構,具備1200億總參數和50億激活參數。該模型支持商業和非商業使用,適用於文本生成任務,特別適合AI Agent系統、聊天機器人等應用開發。
Ken-Z
本模型是基於OpenAI Whisper-small在拉丁語上微調的自動語音識別模型,使用67小時拉丁語音頻數據訓練,字符錯誤率(CER)為20,支持拉丁語語音轉文本任務。
ReportAId
MedWhisper Large ITA是基於OpenAI Whisper Large v3 Turbo的領域適配變體,專門針對意大利語醫療語音識別進行了優化。該模型在精心挑選的意大利語門診專科就診錄音集上使用LoRA技術進行微調,顯著提升了醫學術語和臨床表達的識別準確率。
feelmadrain
這是一個基於OpenAI Whisper Small架構的俄語自動語音識別模型,在Common Voice 17.0數據集上進行了專門訓練,能夠準確地將俄語語音轉換為文本。
openchs
基於OpenAI Whisper Large v2在Common Voice 17.0斯瓦希里語數據集上微調的語音識別模型,專為坦桑尼亞兒童求助熱線的斯瓦希里語語音識別任務設計,相比基礎模型在斯瓦希里語識別準確率上有顯著提升。
Sci-fi-vy
GPT-OSS-20B是OpenAI推出的開放權重模型,專為強大推理、智能體任務和多樣化開發者用例設計。該模型具有210億參數(其中36億為活躍參數),採用混合專家架構,支持低延遲本地部署和特定場景應用。
2imi9
GPT-OSS-20B-NVFP4 是 OpenAI GPT-OSS-20B 模型的量化版本,採用 NVIDIA 先進的 NVFP4 量化格式。該模型在保持顯著內存效率提升的同時,相比 MXFP4 量化能提供更出色的準確率保留率,專為高性能推理場景設計。
professorf
GPT-OSS-20B是OpenAI推出的開放權重模型,擁有210億參數(其中36億為活躍參數),專為低延遲、本地部署和特定用例設計。該模型基於harmony響應格式訓練,具備強大的推理能力和智能體任務處理能力。
mlx-community
這是一個基於OpenAI GPT-OSS-120B模型轉換而來的MLX格式版本,使用mlx-lm 0.27.0工具轉換,支持高效的文本生成任務。
這是OpenAI GPT-OSS-20B模型的MLX格式轉換版本,使用mlx-lm 0.27.0工具進行轉換,支持在Apple Silicon設備上高效運行。模型採用MXFP4-Q8量化技術,在保持性能的同時顯著減少內存佔用。
這是一個基於OpenAI GPT-OSS-20B模型轉換的MLX格式版本,使用mlx-lm 0.27.0工具進行轉換,支持在Apple Silicon設備上高效運行。
arunimas1107
這是一個基於openai/gpt-oss-20b進行醫療領域微調的LoRA適配器模型,專門針對醫療問答、摘要生成和知識檢索等任務進行了優化。該模型通過高效的參數微調技術保留了基礎200億參數模型的通用推理能力,同時增強了在醫療領域的表現。
tiantiaf
基於openai/whisper-small優化的印度多語言分類模型,支持23種印度地區語言的精準識別,為語言識別領域提供高效解決方案。
0xShonen
GPT-OSS-20B是OpenAI發佈的開放權重模型,專為強大的推理、智能體任務和多樣化開發者用例設計。該模型具有21B參數(其中3.6B為活躍參數),支持低延遲推理和本地部署,採用Apache 2.0許可證,可自由用於實驗、定製和商業部署。
giladgd
GPT-OSS-120b-GGUF 是 OpenAI 發佈的 1200 億參數開源文本生成模型,採用 Apache 2.0 寬鬆許可證,支持靈活的推理強度配置和完整思維鏈訪問,具備原生函數調用、網頁瀏覽和代碼執行能力。
GPT-OSS-20b-GGUF 是一個基於 OpenAI GPT-OSS-20b 模型的量化版本,採用 Apache 2.0 許可協議,具有寬鬆的使用條款。該模型支持文本生成任務,具備完整的思維鏈推理能力,並經過原生 MXFP4 量化,可在不同內存條件下高效運行。
bartowski
OpenAI GPT-OSS-120B模型的量化版本,使用llama.cpp工具和imatrix數據集進行量化處理,提供多種量化級別以適應不同硬件需求,支持在LM Studio和llama.cpp環境中運行。
NexaAI
基於OpenAI Whisper架構微調的自動語音識別和語音翻譯模型,通過減少解碼層數量實現顯著速度提升,同時保持接近原版的識別質量。
Stripe Agent Toolkit是一個支持多種AI代理框架(如OpenAI、LangChain、CrewAI等)與Stripe API集成的工具包,提供Python和TypeScript支持,簡化支付相關操作。
Unreal Engine生成式AI支持插件,集成多種前沿LLM/GenAI模型API,提供遊戲開發中的AI集成層支持,包括OpenAI、Claude、Deepseek等模型的聊天、結構化輸出等功能,並支持Model Control Protocol(MCP)實現場景對象控制、藍圖生成等高級功能。
一個基於TypeScript的MCP服務器,可將Claude與任何兼容OpenAI SDK的聊天完成API集成,支持多種AI聊天提供商。
一個集成OpenAI Sora 2視頻生成API的MCP服務器,提供視頻生成、混剪、狀態查詢和自動下載功能
brain-trust是一個MCP服務器,通過3個簡單工具連接IDE與OpenAI,提供智能問答和結構化計劃評審功能,支持Docker部署和多種IDE集成
Codex Bridge是一個輕量級MCP服務器,通過官方CLI連接AI編程助手與OpenAI Codex,支持多客戶端無API成本交互。
一個基於Gradio的AI助手聊天項目,集成OpenAI API和Nmap工具,提供文件系統訪問和網絡掃描功能。
該項目是一個連接OpenAI DALL-E API的MCP服務器,專為Roo Code等AI助手設計,提供全面的圖像生成功能與控制選項。
一個基於Qdrant向量數據庫和OpenAI嵌入的語義搜索服務
o3-search-mcp是一個MCP服務器,支持使用OpenAI的o3模型及其強大的網絡搜索功能,幫助AI編程代理自主解決複雜問題。
MCP應用是一個結合RAG和網絡搜索工具的服務,使用OpenAI嵌入向量存儲,PostgreSQL作為數據庫,PGVector作為向量存儲,支持知識檢索和文檔添加功能。
一個基於MCP協議的語義代碼搜索服務器,支持OpenAI和Ollama兩種嵌入模型,能夠索引本地項目或Git倉庫,提供企業級的私有化代碼搜索解決方案。
該項目實現了一個基於Model Context Protocol (MCP)的文檔檢索服務器,能夠為AI助手動態獲取Python庫的最新官方文檔內容。支持LangChain、LlamaIndex和OpenAI等庫,通過SERPER API進行高效搜索,並使用BeautifulSoup解析HTML內容。項目設計可擴展,便於添加更多庫的支持。
MCP-AWS是一個基於AI的應用程序,通過OpenAI代理和MCP服務器管理AWS EC2實例,支持自然語言命令創建和終止實例。
一個基於Go語言的MCP服務器,通過OpenAI的DALL-E API實現文本描述生成圖像功能,可與Claude等大型語言模型集成使用。
一個基於MCP框架的多功能TTS服務器,整合了Kokoro本地TTS和OpenAI雲端TTS引擎,支持即時音頻流、語音定製及播放控制。
一個基於OpenAI API的音頻轉文字MCP服務器,提供音頻轉錄功能並支持多種配置選項。
Ollama MCP Server是一個連接Ollama本地大語言模型和模型上下文協議(MCP)的橋樑工具,提供完整的API集成、模型管理和執行功能,支持OpenAI兼容的聊天接口和視覺多模態模型。
MCP客戶端模塊配置OpenAI API密鑰
一個通過MCP協議直接查詢OpenAI模型的服務器,支持o3-mini和gpt-4o-mini模型,提供簡潔和詳細的回答。