螞蟻集團百靈大模型系列更新,Ling-2.6-flash正式開放。該模型總參數104B,激活參數7.4B,提供BF16、FP8、INT4等多精度版本,適配不同硬件環境並降低部署門檻。此前以“Elephant Alpha”匿名在OpenRouter平臺測試。
騰訊雲Agent平臺QClaw發佈v0.2.14版本,這是迄今最大更新。升級包括接入Hermes框架,支持創建運行Hermes類型Agent,實現底層模型多元化,大幅降低AI使用門檻,用戶可在單一應用內調度多種模型。
谷歌在Cloud Next 26大會上發佈“代理企業”核心基礎設施,全面重塑AI架構,推動競爭進入以自主智能體爲核心的生產力時代。關鍵更新包括:首次將第八代TPU拆分爲專用訓練版本TPU8t和推理優化版本TPU8i,實現底層算力的“拆分”與“規模”革命。
DeepSeek官方宣佈API已升級至百萬Token上下文版本,與App和網頁版一致,此前僅爲128k tokens。這一更新顯著提升了對話連貫性和信息豐富度。同時,知識庫也更新至2025年5月,用戶可在非聯網狀態下準確獲取該時間點的信息。
Windsurf Wave 3 是一個專注於提升開發者體驗的 AI 編輯器更新版本。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Anthropic
$105
$525
200
Alibaba
$1
$10
256
Bytedance
$0.8
$2
Baidu
-
32
Openai
$0.35
$2.8
400
$8
Chatglm
128
$1.8
$5.4
16
Google
$140
$280
$0.5
Huawei
$17.5
$70
Testament200156
old-MakeGemma3是一個使用mergekit工具合併預訓練語言模型得到的實驗性模型,採用NuSLERP合併方法構建。該模型是多語言功能改進版本的前身,當前已棄用,建議使用更新的Testament200156/MakeGemma3-abliterated版本。
unsloth
Qwen3-4B-Instruct-2507是Qwen3-4B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升。採用Unsloth Dynamic 2.0量化技術,在準確性上表現卓越。
cpatonn
Qwen3-4B-Instruct-2507-AWQ是Qwen3-4B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升。它可用於文本生成等多種場景,為用戶提供高質量的語言交互體驗。
Qwen
Qwen3-30B-A3B-Instruct-2507-FP8是Qwen3-30B-A3B-FP8非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升,支持262,144的原生上下文長度。
Qwen3-30B-A3B-Instruct-2507是Qwen3-30B-A3B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面均有顯著提升。這是一個305億參數的大型語言模型,採用MoE架構,激活參數為33億。
NVFP4
Qwen3-235B-A22B-Instruct-2507是Qwen3系列模型的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升,能提供更優質的文本生成服務。該模型採用混合專家架構,總共235B參數,激活22B參數,原生支持262,144上下文長度。
Mistral-Small-3.2-24B-Instruct-2506 是 Mistral-Small-3.1-24B-Instruct-2503 的小版本更新,改進了指令遵循、減少重複錯誤和函數調用能力,提供更高效、準確的服務。
Mistral-Small-3.2-24B-Instruct-2506是一個圖像文本到文本的模型,是Mistral-Small-3.1-24B-Instruct-2503的更新版本,在指令遵循、減少重複錯誤和函數調用等方面有所改進。
gabriellarson
Mistral-Small-3.2-24B-Instruct-2506是一款語言模型,是Mistral-Small-3.1-24B-Instruct-2503的小版本更新,在指令遵循、減少重複錯誤和函數調用等方面有顯著提升。
mistralai
Mistral-Small-3.2-24B-Instruct-2506是Mistral-Small-3.1-24B-Instruct-2503的小版本更新,改進了指令遵循、減少重複錯誤和函數調用能力。
DeepSeek-V3-0324 是 DeepSeek 團隊發佈的 3 月更新版本,相比前代在多個基準測試上有顯著提升,支持動態量化版本,適用於本地推理。
ltg
這是deberta-v2-xxlarge的更新版本,實現了AutoModelForCausalLM類,使其能夠生成文本。修復了原始實現中的三個問題,包括輸出嵌入權重名稱、增強掩碼解碼器實現和位置嵌入截斷處理。
jondurbin
百吉餅模型是基於更新後的yi-34b-200k進行微調的版本,具備出色的長上下文支持能力。該模型通過直接偏好優化(DPO)進行了額外調整,在處理長文本時表現更佳,支持多種提示格式和特殊提示策略。
Kooten
無畏女僕-20B-V1.1是基於DaringMaid-20B的升級版本,主要更新是將Noromaid-13b從v0.1.1替換為v0.3版本,並略微提高了Noromaid的權重,以確保更好的兼容性。
Undi95
ReMM-SLERP是對原始MythoMax-L2-13B的重構版本,採用SLERP技術融合了更新後的多個13B參數模型,包括Chronos-Beluga、Airoboros和Huginn等。
sazyou-roukaku
chilled_remix和reversemix是文本到圖像生成模型,專為圖像創作領域設計。它們提供多樣化的圖像生成效果,在版本更新後對使用限制進行了優化,特別適合LORA愛好者使用,能實現更穩定的面部真實感。
一個為開發者提供統一訪問多個庫文檔的MCP服務器,支持文檔聚合、搜索、版本管理和自動更新功能。
安全MCP技能版本管理器,支持自動檢測更新、安全掃描、多版本管理、智能合併和A/B測試。
一個基於Model Context Protocol (MCP)的Smartsheet API交互服務器,提供搜索、檢索和更新Smartsheet表格的功能,支持版本備份和格式化響應。