全球AI算力競賽升級,馬斯克宣佈xAI旗下新模型Grok V9-Medium完成訓練。該模型擁有1.5萬億參數,是當前Grok所用v8-small版本的三倍,標誌着推理與複雜任務處理能力的重大突破。
面壁智能聯合清華大學及OpenBMB開源社區,發佈並開源了中國首個基於華爲昇騰平臺訓練的三值(1.58-bit)大模型BitCPM-CANN。該模型在低比特訓練領域取得突破,實現從量化算子到訓練算法的全鏈路原生開發,推出0.5B至8B四個尺寸版本,展示了國產算力平臺的強大實力。
字節跳動Seed團隊發佈新一代視頻創作模型Seedance2.0,採用統一的多模態音視頻聯合生成架構,推動AI視頻生成從“單點突破”邁向“全能協作”的工業級應用階段。相比1.5版本,新模型在複雜交互與運動場景下的可用率顯著提升,通過出色的物理還原能力,攻克了雙人花滑、多人競技等高難度動作生成難題。
騰訊混元3D Studio升級至1.2版本並開放公測,顯著提升了3D資產生成的專業性與可控性。其組件生成能力PartGen升級至1.5版本,核心拆分精度提高至$1536^3$分辨率,更好地保留模型細節。新版本還引入了創新的“筆刷交互”功能,增強了用戶操作體驗。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$1
$10
256
-
Bytedance
$0.8
$2
128
$0.15
$1.5
Baidu
32
$8
jayn7
騰訊混元視頻1.5模型的量化GGUF版本,專門用於文本到視頻生成任務,支持720P高清視頻生成,提供多種量化精度版本以優化使用效率。
本項目提供騰訊混元視頻1.5文本到視頻模型的量化GGUF版本,支持480P視頻生成任務,包含蒸餾模型和完整模型兩個版本,可與ComfyUI-GGUF等工具配合使用。
騰訊混元視頻1.5模型的量化GGUF版本,專門用於圖像轉視頻和視頻生成任務。提供480P分辨率的蒸餾模型和標準模型,支持多種量化精度,包括Q4_K_S、Q8_0和FP16等。
MaziyarPanahi
VibeThinker-1.5B-GGUF 是 WeiboAI/VibeThinker-1.5B 模型的 GGUF 量化版本,由 MaziyarPanahi 進行量化處理。該模型是一個 1.5B 參數的文本生成模型,支持多種量化級別(2位到8位),便於在各種硬件上高效運行。
noctrex
本項目是卡納娜1.5-15.7B-A3B指令模型的MXFP4_MOE量化版本,可在特定場景下提升模型的運行效率。該模型基於kakaocorp/kanana-1.5-15.7b-a3b-instruct進行優化,採用混合專家架構和MXFP4量化技術。
Kwai-Keye
快手Keye-VL是由快手Keye團隊打造的前沿多模態大語言模型,在視頻理解、視覺感知和推理任務中表現卓越。1.5版本通過創新的快慢視頻編碼策略、LongCoT冷啟動數據管道和強化學習訓練策略,在視頻理解、圖像感知和推理能力上達到新高度,支持長達128k標記的擴展上下文長度。
mradermacher
這是Veri - Code/ReForm - SFT - 1.5B模型的靜態量化版本,專為代碼生成、強化學習和形式驗證等任務優化,提供多種量化類型選擇,顯著提升推理效率。
bartowski
NVIDIA OpenReasoning - Nemotron - 1.5B的量化版本,通過llama.cpp工具優化,提升在不同硬件上的運行效率和性能。
tdh111
微軟開發的1.58位量化大語言模型,專為高效推理設計,提供IQ2_BN和IQ2_BN_R4兩種量化版本
DavidAU
這是一個Qwen2.5 MOE(專家混合)模型,由兩個Qwen 2.5 DeepSeek(審查版/普通版和無審查版)1.5B模型組成,形成一個4B模型,其中無審查版本的DeepSeek Qwen 2.5 1.5B主導模型行為。
RedHatAI
這是DeepSeek-R1-Distill-Qwen-1.5B的INT4量化版本,通過權重量化技術將模型大小減少約75%,同時保持接近原始模型的性能,在推理速度上最高可實現1.5倍加速。
tensorblock
通義千問1.5版本的混合專家(MoE)模型,參數規模為2.7B,提供多種量化版本的GGUF格式文件
qilowoq
這是BAAI/bge-reranker-v2-m3的精簡版本,僅保留英文和俄文的詞彙表,比原始模型小1.5倍,同時能生成相同的嵌入向量。
ItsMeBell
LarosBell-XL是一個專注於從文本提示生成高質量3D動漫圖像的融合模型,v2版本在人體結構上有顯著改進,風格更接近SD 1.5版本的LarosBell
dataautogpt3
ProteusV0.3是基於OpenDalleV1.1的重大升級版本,新增了20萬張動漫相關圖像並精選1.5萬張進行優化。該模型在保持提示詞理解能力的同時,顯著提升了燈光效果和美學表現,支持逼真寫實和風格化圖像生成,且不會出現災難性遺忘問題。
TencentARC
T2I適配器是一種為穩定擴散模型提供額外條件控制的網絡架構,本檢查點專為穩定擴散1.5版本提供草圖條件控制功能。
T2I適配器是一種為穩定擴散模型提供額外條件控制的網絡,本檢查點專為穩定擴散1.5版本提供深度條件控制。
plasmo
由Woolitize團隊打造的黏土風格圖像生成模型,適配Stable Diffusion 1.5版本
coreco
Seek.art MEGA 是一款通用型'全能'文生圖模型,在數十種風格上顯著超越Stable Diffusion 1.5版本,由Coreco團隊開發。
dreamlike-art
基於SD 1.5版本的高質量藝術微調模型,專注於生成藝術性圖像