OpenAI升級Sora視頻生成API,基於Sora2模型推出五項核心能力,重點解決批量視頻製作中的角色一致性、時長和格式適配問題。關鍵改進在於角色一致性,開發者可預先定義角色檔案,避免主角在不同場景中出現面部、服裝等視覺漂移,顯著提升規模化生產效率。
谷歌推出Gemini Embedding2,這是首款基於Gemini架構的多模態嵌入模型,已在Gemini API和Vertex AI開放預覽。該模型將文本、圖像、視頻、音頻和文檔等數據類型映射到統一嵌入空間,實現跨模態檢索與分類,支持超過100種語言。
火山引擎發佈ArkClaw,解決AI Agent部署難題。它作爲雲上SaaS版OpenClaw,將頂級開源Agent框架能力網頁化,用戶無需配置環境、購買算力或管理API,打開網頁即可獲得24小時在線的AI自動機,簡化了強大AI功能的使用流程。
OpenAI推出開源開發者支持計劃,爲公共軟件項目維護者提供爲期六月的ChatGPT Pro免費使用權,包含Codex模型、高額API額度及全新代碼安全審查工具Codex Security,旨在通過前沿AI技術賦能開發者。
強大的 API 市場,便捷集成多種 AI 接口。
通過簡單API將社交媒體視頻轉化為結構化數據,含摘要、轉錄等。
NanoBanana 2 API 提供高品質 AI 圖像生成服務,有免費額度,易於整合。
Seedance 2.0 API支持文生視頻、圖生視頻,輸出1080p,含原生音頻。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
-
Anthropic
$105
$525
200
Google
$0.7
$7
$35
$21
Alibaba
Deepseek
$4
$12
128
Tencent
$1
32
$0.35
400
Chatglm
$0.8
$2
$0.2
Huawei
$14
$56
$2.4
$9.6
shorecode
這是一個高效的文本摘要模型,專門設計用於壓縮大語言模型提示中的文本內容,能夠實現7倍以上的壓縮率,顯著降低API調用成本。
Roblox
RoGuard 1.0 是一款基於Llama-3.1-8B-Instruct微調的大語言模型,專注於提升文本生成API的安全性。
Roblox Guard 1.0是一款基於Llama-3.1-8B-Instruct微調的最先進指令微調大語言模型,專門設計用於保護文本生成API的安全。它能夠在提示詞和回覆層面進行雙級安全分類,有效審核用戶查詢和模型輸出,確保內容符合安全政策。
RoGuard 1.0 是一款基於 Llama-3.1-8B-Instruct 微調的先進大語言模型,專門用於為大語言模型提供安全保障。它能夠在提示和回覆兩個層面進行安全分類,判斷輸入或輸出是否違反安全政策,為文本生成API提供強大的安全護欄。
stablediffusionapi
基於Stable Diffusion API的文本到圖像生成模型,能夠根據輸入的文本描述生成超逼真的圖像,適用於多種創意場景和藝術創作需求。
litert-community
這是Qwen2.5-0.5B-Instruct模型的LiteRT優化版本,專門針對移動設備部署進行了優化。該模型提供了多種量化變體,支持在Android設備上通過LiteRT框架和MediaPipe LLM推理API進行高效部署。
Salesforce
xLAM-2系列是基於APIGen-MT框架訓練的大型動作模型,專注於多輪對話和函數調用能力,適用於AI代理開發。
基於DeepSeek-R1-Distill-Qwen-1.5B的多個變體,適配LiteRT框架和MediaPipe LLM推理API,可部署於Android平臺。
xLAM-7b-fc-r 是 Salesforce 推出的一個針對函數調用優化的 7B 參數大型語言模型,能夠根據輸入查詢和可用 API 提供快速、準確且結構化的響應。
apipack
基於CodeLlama-13b-hf架構微調的大語言模型,專門針對API調用生成任務優化
NexaAI
章魚模型V2是一款20億參數的開源語言模型,專為安卓API優化,採用功能令牌策略提升推理速度和準確性。
gorilla-llm
Gorilla OpenFunctions v2 是一個開源的大型語言模型,能夠根據自然語言指令和API上下文生成可執行的API調用。
aligner
一個與模型無關的即插即用模塊,適用於開源和基於API的模型,採用殘差校正策略增強AI安全性
AlbedoBase XL 2.0 是一款文本到超逼真圖像的生成模型,通過API實現高效圖像轉換,無需支付費用即可使用。
Gorilla OpenFunctions 擴展了大型語言模型的聊天完成功能,使其能夠根據自然語言指令和 API 上下文生成可執行的 API 調用。
cooperleong00
基於DeBERTa-v3-large微調的毒性分類器,專門用於高效準確地評估文本毒性。該模型作為Perspective API的替代方案,在90k RTP樣本上訓練,在保留測試集上達到94.87%準確率和98.54% AUROC分數。
SDVN5-3DCuteWave API推理可助力實現文本到超逼真圖像的轉換,為用戶帶來高質量的圖像生成體驗。
squarelike
基於ShareGPT數據集和DeepL翻譯API訓練的韓英/英韓雙向翻譯模型
api19750904
一個基於PyTorch和HuggingPics構建的圖像分類模型,專門用於食物分類
SEBIS
基於t5-base架構的預訓練模型,專為Java API推薦生成任務設計
該項目為Notion API實現了一個MCP服務器,允許通過模型上下文協議訪問和操作Notion內容,支持搜索、評論、添加頁面等功能。
Sail是一個旨在統一流處理、批處理和計算密集型(AI)工作負載的項目,提供了Spark SQL和Spark DataFrame API的替代方案,支持單機和分佈式環境。
該項目是一個MCP服務器,用於通過Obsidian的Local REST API插件與Obsidian筆記應用交互。它提供了多種工具來操作和管理Obsidian中的文件,包括列出文件、獲取文件內容、搜索、修改內容和刪除文件等。
一個功能豐富的Markdown排版工具,支持多種樣式主題和平臺適配,提供即時編輯預覽、圖片導出和API集成能力
ElevenLabs官方MCP服務器,提供文本轉語音和音頻處理API交互能力
Exa MCP Server是一個為AI助手(如Claude)提供網絡搜索功能的服務器,通過Exa AI搜索API實現實時、安全的網絡信息獲取。
一個為Claude/Cursor設計的OpenAPI規範探索服務器,通過三步流程幫助用戶搜索和理解API文檔。
PaperBanana是一個自動化生成學術圖表和統計圖的智能框架,支持從文本描述生成高質量的論文插圖,採用多智能體管道和迭代優化,提供CLI、Python API和MCP服務器等多種使用方式。
MiniMax Model Context Protocol (MCP) 是一個官方服務器,支持與強大的文本轉語音、視頻/圖像生成API交互,適用於多種客戶端工具如Claude Desktop、Cursor等。
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Anna's Archive的MCP服務器和CLI工具,用於搜索和下載該平臺的文檔,支持通過API密鑰訪問。
Framelink Figma MCP Server是一個為AI編程工具(如Cursor)提供Figma設計數據訪問的服務器,通過簡化Figma API響應,幫助AI更準確地實現設計到代碼的一鍵轉換。