11月6日,科大訊飛在第八屆世界聲博會暨全球1024開發者節上發佈“訊飛星火X1.5”大模型及系列AI產品,主題爲“更懂你的AI”。董事長劉慶峯通過數據強調AI技術的行業價值。該模型在國內算力平臺完成全鏈路訓練,效率顯著提升,支持130種語言處理。
谷歌發佈AI文件類型檢測工具Magika 1.0穩定版,通過優化的深度學習模型提升檢測速度、安全性和準確性,解決傳統方法誤判問題。該開源工具已整合至Gmail等谷歌產品中。
Snap與Perplexity達成4億美元戰略合作,將AI搜索引擎集成至Snapchat。Perplexity模型將爲9.4億月活用戶提供問答服務,成爲"My AI"聊天機器人核心引擎。該功能預計2026年初上線,強化Snap在AI商業化的佈局。
Meta在歐洲推出AI短視頻平臺Vibes,功能類似TikTok,所有視頻均由AI生成。這是繼美國上線六週後的歐洲擴張,恰逢OpenAI發佈Sora視頻生成模型,顯示AI視頻領域競爭加劇。
基於Tongyi Wan 2.2 Plus模型,可快速生成高質量AI視頻,功能強大
集成多AI模型,可通過對話生成圖像、視頻和聲音,優化創意流程。
LTX-2 是代多模態 AI 視頻生成模型。
ArtAny AI整合多種AI模型,免費生成圖像與視頻,有熱門優惠
xai
$2.16
輸入tokens/百萬
$3.6
輸出tokens/百萬
1M
上下文長度
anthropic
$108
$540
200k
chatglm
$0.43
$1.01
131.1k
moonshotai
$4.1
$16.56
128k
$21.6
mistral
-
google
$18
upstage
64k
openai
$72
reka-ai
65.5k
$0.72
$2.88
智谱ai
$4.5
$22.5
aws
$0.5
SadraCoding
SDXL-Deepfake-Detector 是一款精準檢測 AI 生成人臉的工具,專注於維護數字世界的真實性,為抵禦視覺虛假信息提供隱私保護且開源的解決方案。該模型通過微調預訓練模型實現輕量級且高準確率的檢測。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持以及強大的空間和視頻動態理解能力。該模型採用2B參數規模,支持指令交互,適用於多模態AI應用。
alenphilip
這是一款專門用於Python代碼審查的AI模型,基於Qwen2.5-7B-Instruct微調,能夠識別安全漏洞、性能問題並提供代碼質量改進建議。
pnnbao-ump
VieNeu-TTS是首個可在個人設備上運行的越南語文本轉語音模型,具備即時語音克隆能力。基於NeuTTS Air微調,能夠生成自然逼真的越南語語音,在CPU上具備即時性能。
TheStageAI
TheWhisper-Large-V3-Turbo 是 OpenAI Whisper Large V3 模型的高性能微調版本,由 TheStage AI 針對多平臺即時、低延遲和低功耗語音轉文本推理進行優化。支持流式轉錄、單詞時間戳和可擴展性能,適用於即時字幕、會議和設備端語音界面等場景。
TheWhisper-Large-V3是OpenAI Whisper Large V3模型的高性能微調版本,由TheStage AI針對多平臺(NVIDIA GPU和Apple Silicon)的即時、低延遲和低功耗語音轉文本推理進行了優化。
Mungert
PokeeResearch-7B是由Pokee AI開發的70億參數深度研究代理模型,結合了AI反饋強化學習(RLAIF)和強大的推理框架,能夠在工具增強的大語言模型中實現可靠、對齊和可擴展的研究級推理,適用於複雜的多步驟研究工作流程。
nineninesix
KaniTTS是一款專為即時對話式人工智能應用優化的高速、高保真阿拉伯語文本轉語音模型。它採用兩階段流水線架構,結合大語言模型與高效音頻編解碼器,實現卓越的速度和音頻質量,能夠滿足對話式AI、無障礙輔助、研究等多領域的語音合成需求。
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型,通過獨特的兩階段架構結合大語言模型與高效音頻編解碼器,實現低延遲與高質量語音合成,即時因子低至0.2,比即時速度快5倍。
dx8152
文心圖像融合Lora模型是一個專門用於圖像融合和編輯的AI模型,能夠糾正產品透視角度、調整光影效果,並使產品自然地融入背景環境,實現高質量的圖像合成效果。
LiquidAI
LFM2-VL-3B是Liquid AI開發的多模態視覺語言模型,基於LFM2骨幹架構構建,具備強大的視覺理解和推理能力,特別在細粒度感知任務上表現出色。該模型能夠高效處理文本和圖像輸入,支持高達512×512分辨率的原生圖像處理。
noctrex
這是慧慧AI模型Huihui-MoE-60B-A3B-abliterated的MXFP4_MOE量化版本,為文本生成提供支持。該量化版本基於特定的基礎模型進行處理,能在一定程度上優化模型的性能和使用體驗。
deepseek-ai
DeepSeek-OCR是DeepSeek AI開發的一款先進的光學字符識別模型,專注於探索視覺文本壓縮的邊界,能夠高效地從圖像中提取和轉換文本內容。
citizenplain
這是一個基於Wan2.1-T2V-14B模型訓練的LoRA適配器,專門用於文本到視頻轉換任務。該模型使用AI Toolkit訓練,為視頻生成應用提供支持。
lichorosario
這是一個基於Qwen-Image模型訓練的LoRA(Low-Rank Adaptation)模型,專門用於文本到圖像的生成任務。該項目使用AI Toolkit訓練,能夠將文本描述轉化為高質量的圖像,支持在多種圖像生成工具中使用。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基於OpenAI gpt-oss-120b模型的優化版本,採用混合專家(MoE)架構,具備1200億總參數和50億激活參數。該模型支持商業和非商業使用,適用於文本生成任務,特別適合AI Agent系統、聊天機器人等應用開發。
hyperchainsad
這是一個基於Wan2.2-T2V-A14B基礎模型訓練的文本到視頻LoRA模型,使用AI Toolkit工具包進行訓練,專門用於增強文本到視頻的轉換能力。
Zlikwid
這是一個基於Qwen/Qwen-Image-Edit-2509基礎模型訓練的LoRA圖像生成模型,專門用於圖像到圖像的轉換任務,使用AI Toolkit by Ostris進行訓練。
expert78
kontext-dusk-3-lora是一個基於FLUX.1-Kontext-dev基礎模型訓練的LoRA圖像生成模型,專門用於生成黃昏藍調時刻風格的圖像。該模型通過特定觸發詞觸發,支持多種主流AI圖像生成工具使用。
abhi099k
基於DeBERTa-v3-large微調的AI文本檢測模型,能夠準確識別文本是由人類撰寫還是AI生成,在自定義數據集上訓練達到約97%的準確率。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
PG-MCP是一個為PostgreSQL數據庫設計的模型上下文協議服務器,提供AI代理發現、連接、查詢和理解數據庫的API,支持多數據庫連接、豐富的目錄信息和查詢解釋功能。
HiveChat是一個專為中小團隊設計的AI聊天應用,支持多種大模型服務商,提供分組管理、Token限額、第三方登錄等功能。
Genkit是一個用於構建AI驅動應用的開源框架,提供Node.js和Go庫,支持多種AI模型和向量數據庫集成,包含開發工具和插件生態系統。
UnityMCP是一個Unity編輯器插件,實現模型上下文協議(MCP),提供Unity與AI助手的無縫集成,包括即時狀態監控、遠程命令執行和日誌功能。
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
Supabase MCP Server是一個連接Supabase項目與AI助手的工具,通過Model Context Protocol(MCP)標準化大型語言模型(LLMs)與外部服務的交互,實現數據庫管理、配置獲取和數據查詢等功能。
MCP Atlassian是一個為Atlassian產品(Confluence和Jira)設計的模型上下文協議服務器,支持雲端和本地部署,提供AI助手集成功能。
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Notion MCP服務器是一個通過官方SDK連接AI模型與Notion工作區的協議服務,提供全面的Notion操作工具集。
Perplexity MCP Server是一個智能研究助手,利用Perplexity的AI模型自動分析查詢複雜度並選擇最佳模型處理請求,支持搜索、推理和深度研究三種工具。
PAELLADOC是一個AI優先的開發框架,通過實現模型上下文協議(MCP)和五大哲學原則,徹底改變了AI時代的軟件開發方式。
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Godot MCP是一個為Godot遊戲引擎設計的模型上下文協議服務器,提供編輯器控制、項目運行、調試輸出捕獲等功能,支持AI助手與Godot引擎的交互。
Wren Engine是一個為MCP客戶端和AI代理設計的語義引擎,提供語義層支持,使AI能準確理解企業數據模型和業務邏輯。它支持多種數據源,嵌入MCP客戶端,確保數據交互的精確性和治理。
這是一個基於Docker容器的AI開發工具項目,通過Markdown文件編寫複雜工作流,結合Docker化工具和用戶自選的LLM模型,實現多模型代理和項目優先設計的工作流程。
K8M是一款AI驅動的輕量級Kubernetes控制檯工具,集成大模型能力,支持多集群管理和MCP服務。
該項目為LangChain提供Model Context Protocol(MCP)工具調用支持,通過MCP工具包實現與AI模型的交互,如文件讀取和摘要生成。
mcp-hfspace是一個連接Hugging Face Spaces的MCP服務器,支持圖像生成、語音處理、視覺模型等多種AI功能,簡化了與Claude Desktop的集成。