騰訊自研大模型混元2.0(Tencent HY2.0)正式發佈,與此同時,DeepSeek V3.2也逐步接入騰訊生態。目前,這兩大模型已在元寶、ima等騰訊AI原生應用中率先上線,騰訊雲也同步開放了相關模型的API及平臺服務。 全新發布的Tencent HY2.0採用混合專家(MoE)架構,總參數量高達4
生數科技發佈Vidu Q2版本“生圖全家桶”,集成參考生圖、文生圖與圖像編輯三大功能。新版本上線首日使用量突破50萬次,顯示用戶需求旺盛。Vidu Q2增強了圖像生成控制力,支持精準指定畫面位置、動作與構圖,並輸出4K畫質。新增圖像編輯功能包括局部重繪和材質替換,在國際評測中表現優異。
哈佛大學青年民調顯示,59%的美國年輕人(18-29歲)擔憂AI影響就業前景,其中26%認爲威脅嚴重,僅23%完全不擔心。相比外包(48%)和移民,年輕人對AI的就業衝擊更爲憂慮。
OpenAI以全股票形式收購波蘭初創公司Neptune,交易金額低於4億美元。這是OpenAI 2025年第四次收購,旨在將Neptune的模型監控與調試能力整合進GPT訓練基礎設施。Neptune服務將於2026年第一季度前逐步關停,團隊整體加入OpenAI。
ByteDance的Seedream 4.5 AI可提供4K電影級視覺效果,適用於電商和廣告設計。
Seedream 4.5可創建4K視覺效果,支持多語言文本,適用於專業創作。
Runway Gen 4.5 AI可生成1080p電影級視頻,具備導演模式和物理模擬
Gen-4.5是先進AI視頻生成平臺,可將文本和圖像轉為專業視頻
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
Xai
$1.4
$3.5
2k
Anthropic
$7
$35
200
$21
$105
Bytedance
-
$0.8
$2
128
Alibaba
$0.4
$0.35
400
64
$525
Huawei
32
Chatglm
$8
$16
$1.8
$5.4
16
Tencent
John1604
Qwen3 VL 4B Thinking 是一個支持圖像到文本以及文本到文本轉換的多模態模型,具有4B參數規模,能夠滿足多種圖文交互需求。
lightx2v
本倉庫包含為HunyuanVideo-1.5優化的4步蒸餾模型,能夠在不使用CFG(無分類器指導)的情況下實現超快速的4步推理,顯著減少生成時間,同時保持高質量的視頻輸出。
pramjana
Qwen3-VL-4B-Instruct是阿里巴巴推出的40億參數視覺語言模型,基於Qwen3架構開發,支持多模態理解和對話任務。該模型具備強大的圖像理解和文本生成能力,能夠處理複雜的視覺語言交互場景。
jayn7
本項目提供騰訊混元視頻1.5文本到視頻模型的量化GGUF版本,支持480P視頻生成任務,包含蒸餾模型和完整模型兩個版本,可與ComfyUI-GGUF等工具配合使用。
騰訊混元視頻1.5模型的量化GGUF版本,專門用於圖像轉視頻和視頻生成任務。提供480P分辨率的蒸餾模型和標準模型,支持多種量化精度,包括Q4_K_S、Q8_0和FP16等。
Owen777
UltraFlux是一款基於Flux的擴散變換器,專門用於原生4K文本到圖像生成。它通過數據、架構和損失的協同設計,能夠在各種不同縱橫比下保持一致的圖像質量。
MaziyarPanahi
本項目提供了Qwen3-4B-Thinking-2507模型的GGUF格式文件,這是一個具有思維鏈推理能力的4B參數大語言模型,支持多種量化版本,便於在各種硬件上部署運行。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
Intel
DeepMath是一個40億參數的數學推理模型,基於Qwen3-4B Thinking構建,結合了微調的大語言模型與沙盒化Python執行器。它能夠為計算步驟生成簡潔的Python代碼片段,顯著減少錯誤並縮短輸出長度。
Nanbeige
楠米色4-3B-思維-2511是楠米色系列的最新增強版本,通過先進的蒸餾技術和強化學習優化,在緊湊的3B參數規模下實現了強大的推理能力。該模型在Arena-Hard-V2和BFCL-V4等基準測試中,在參數小於32B的模型中取得了最先進(SOTA)成果。
mlx-community
VibeThinker-1.5B的4位量化版本,基於MLX框架針對蘋果芯片優化,是一個擁有15億參數的密集語言模型,專門用於數學推理和算法編碼問題
bartowski
這是一個基於REAP方法對MiniMax-M2中40%專家進行均勻剪枝得到的139B參數大語言模型,採用GLM架構和專家混合(MoE)技術,通過llama.cpp進行多種量化處理,適用於文本生成任務。
這是p-e-w/gpt-oss-20b-heretic模型的量化版本,使用llama.cpp的imatrix技術進行量化處理。該模型是一個200億參數的大語言模型,提供了多種量化選項,從高質量到低質量不等,文件大小從41.86GB到11.52GB,適用於不同硬件條件。
hum-ma
Wan2.2-TI2V-5B-Turbo-GGUF是基於quanhaol/Wan2.2-TI2V-5B-Turbo基礎模型轉換而來的圖像轉視頻模型,經過優化可在4GB GPU上運行,具有出色的通用性和高效推理能力。
TeichAI
這是一個基於Claude Sonnet 4.5推理數據集訓練的30B參數大語言模型,專門針對高難度推理任務進行優化,在編碼和科學領域表現出色。
這是一個基於Qwen3 30B A3B模型,在Claude Sonnet 4.5高推理難度數據集上訓練的蒸餾模型。該模型專門針對複雜推理任務進行優化,在編碼和科學領域表現出色,具備較強的邏輯推理能力。
ilyasaqit
這是Helsinki-NLP/opus-mt-en-ber模型的微調版本,專門用於英語到阿特拉斯塔馬齊格語的翻譯。模型基於MarianMT架構,使用48.6萬對合成句子對進行訓練,支持塔馬齊格語、塔什利特語和中阿特拉斯塔馬齊格語的翻譯任務。
magiccodingman
這是一個基於Qwen3 4B Instruct模型的混合量化版本,採用MXFP4和混合權重技術,在保持近乎無損精度的同時實現了更小的文件大小和更高的推理速度。
這是一個基於Qwen3 4B模型的混合量化版本,採用MXFP4_MOE混合權重技術,在保持近乎無損精度的同時實現了更小的文件大小和更高的推理速度。該模型通過精心組合MXFP4和高精度嵌入/輸出權重,達到了接近Q8量化的精度水平,同時具備Q4-Q6級別的吞吐量。
FastVideo
FastVideo團隊推出的圖像轉視頻模型,屬於CausalWan2.2 I2V A14B系列,支持8步推理,能適配從H100到4090等多種GPU,也支持Mac用戶使用。
n8n是一個面向技術團隊的工作流自動化平臺,結合了代碼靈活性和無代碼速度,提供400+集成、原生AI功能和公平代碼許可,支持自託管或雲端部署。
TurboVault是一個生產級的MCP服務器,將Obsidian知識庫轉換為由AI驅動的智能知識系統,提供44個專業工具用於筆記的讀寫、搜索、分析和管理,具有亞100毫秒的性能表現。
一個集成4o-image API的MCP服務器實現,支持通過標準化協議讓LLM和AI系統生成和編輯圖像,包括文本生成圖像、圖像編輯等功能。
pyResToolbox MCP服務器是一個生產就緒的AI工具,將石油工程計算庫pyResToolbox的47個工具通過Model Context Protocol集成到Claude等AI助手中,支持PVT分析、井性能計算、油藏模擬等專業計算。
這是一個為VSCode設計的MCP服務器,專門用於搜索Lean Mathlib 4的文檔,允許用戶查詢聲明、模塊和實例並獲取相關文檔鏈接和詳細信息。
一個集成4o-image API的MCP服務器,支持通過文本生成和編輯圖像。
NewsNow的官方MCP服務器,提供40多個新聞源
GLM-4.6 MCP服務器是一個企業級架構諮詢協議橋接服務,通過模型上下文協議連接Claude 4.5 Sonnet和GLM-4.6,提供系統設計、可擴展性模式和技術決策支持,支持代碼架構分析、系統架構設計和決策審查等功能。
BinAssistMCP是一個連接Binary Ninja與大型語言模型(LLM)的MCP服務,提供40多種逆向工程工具,支持雙傳輸協議和智能上下文管理
基於Rust的《女神異聞錄4黃金版》內存修改工具,可即時修改遊戲內金錢數值
Cinema4D MCP Server是一個連接Cinema 4D與Claude的橋樑,通過提示詞輔助進行3D場景操作和建模。
基於火山引擎Seedream 4.0 API的MCP工具集,提供文生圖、圖生圖、多圖融合和組圖生成功能,支持七牛雲自動上傳、提示詞模板和圖片本地保存。
設置4K YouTube視頻的MCP複製FLUX服務
這是一個為Google Analytics 4提供MCP服務的服務器項目,包含數據獲取、資源查詢和數據分析等功能,需通過Google服務賬號認證使用。
設置4K YouTube視頻的教程
一個幫助技術教練創建結構化學習小時會議內容的MCP服務,遵循4C學習模型生成包含連接、概念、實踐和總結的完整60分鐘技術練習課程計劃
3xpl API的MCP服務器實現,允許LLM通過JSON API與48條區塊鏈數據交互,提供多種區塊鏈查詢和聚合工具。
Unsloth MCP Server是一個用於高效微調大語言模型的服務器,通過優化算法和4位量化技術,實現2倍訓練速度提升和80%顯存節省,支持多種主流模型。
一個包含MCP客戶端插件的Godot 4示例項目,用於演示在遊戲運行時通過Claude等AI工具即時查看、修改場景節點屬性及調用方法,實現AI輔助調試與開發。
Gemini CLI與Google Apps Script構建的MCP服務器結合,通過低代碼平臺擴展了Google Workspace的自動化能力,提供了41種工具支持,涵蓋Gmail、Drive、Calendar等服務,實現複雜任務的多步驟執行。