Telegram官方Bot API 9.5版本將於2026年3月1日發佈,核心更新是全面開放sendMessageDraft方法。此前該功能僅限特定場景,現在所有聊天機器人(包括私聊、羣組、話題等)均可實現流式傳輸,使AI回覆能像ChatGPT一樣邊生成邊顯示,顯著提升交互體驗。開源AI框架OpenClaw已率先完成適配。
深度求索將於下週推出多模態大模型DeepSeek V4,原生支持圖像、視頻和文本生成。這是繼今年1月發佈R1推理模型後的首次重大更新,旨在滿足國內對低成本開源模型的需求,推動AI發展。同時將發佈簡要技術說明,詳細版本預計一個月後推出。
阿里巴巴將在除夕夜開源新一代千問模型Qwen3.5,該模型在架構上全面創新,旨在提升AI應用效果和靈活性。此舉預計將吸引廣泛關注,進一步推動阿里在智能技術領域的影響力。儘管先前版本曾因回答不一致受到批評,但此次更新有望改善。
DeepSeek於2月11日灰度更新網頁端和APP端,14日正式官宣爲新長文本模型結構測試。此次更新支持最高100萬token超長上下文,知識庫更新至2025年5月。但API服務仍爲V3.2版本,僅支持128K上下文。業內視此次更新爲下一代V4模型發佈前的技術預熱和壓力測試,引發對V4的廣泛期待。更新後,DeepSeek的交互風格也發生明顯變化。
Windsurf Wave 3 是一個專注於提升開發者體驗的 AI 編輯器更新版本。
Xai
$1.4
輸入tokens/百萬
$3.5
輸出tokens/百萬
2k
上下文長度
Anthropic
$105
$525
200
Alibaba
$1
$10
256
Bytedance
$0.8
$2
Baidu
-
32
Openai
$0.35
$2.8
400
$8
Chatglm
128
$1.8
$5.4
16
Google
$140
$280
$0.5
Huawei
$17.5
$70
Testament200156
old-MakeGemma3是一個使用mergekit工具合併預訓練語言模型得到的實驗性模型,採用NuSLERP合併方法構建。該模型是多語言功能改進版本的前身,當前已棄用,建議使用更新的Testament200156/MakeGemma3-abliterated版本。
unsloth
Qwen3-4B-Instruct-2507是Qwen3-4B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升。採用Unsloth Dynamic 2.0量化技術,在準確性上表現卓越。
cpatonn
Qwen3-4B-Instruct-2507-AWQ是Qwen3-4B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升。它可用於文本生成等多種場景,為用戶提供高質量的語言交互體驗。
Qwen
Qwen3-30B-A3B-Instruct-2507-FP8是Qwen3-30B-A3B-FP8非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升,支持262,144的原生上下文長度。
Qwen3-30B-A3B-Instruct-2507是Qwen3-30B-A3B非思考模式的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面均有顯著提升。這是一個305億參數的大型語言模型,採用MoE架構,激活參數為33億。
NVFP4
Qwen3-235B-A22B-Instruct-2507是Qwen3系列模型的更新版本,在通用能力、長尾知識覆蓋、用戶偏好對齊和長上下文理解等方面有顯著提升,能提供更優質的文本生成服務。該模型採用混合專家架構,總共235B參數,激活22B參數,原生支持262,144上下文長度。
Mistral-Small-3.2-24B-Instruct-2506 是 Mistral-Small-3.1-24B-Instruct-2503 的小版本更新,改進了指令遵循、減少重複錯誤和函數調用能力,提供更高效、準確的服務。
Mistral-Small-3.2-24B-Instruct-2506是一個圖像文本到文本的模型,是Mistral-Small-3.1-24B-Instruct-2503的更新版本,在指令遵循、減少重複錯誤和函數調用等方面有所改進。
gabriellarson
Mistral-Small-3.2-24B-Instruct-2506是一款語言模型,是Mistral-Small-3.1-24B-Instruct-2503的小版本更新,在指令遵循、減少重複錯誤和函數調用等方面有顯著提升。
mistralai
Mistral-Small-3.2-24B-Instruct-2506是Mistral-Small-3.1-24B-Instruct-2503的小版本更新,改進了指令遵循、減少重複錯誤和函數調用能力。
DeepSeek-V3-0324 是 DeepSeek 團隊發佈的 3 月更新版本,相比前代在多個基準測試上有顯著提升,支持動態量化版本,適用於本地推理。
ltg
這是deberta-v2-xxlarge的更新版本,實現了AutoModelForCausalLM類,使其能夠生成文本。修復了原始實現中的三個問題,包括輸出嵌入權重名稱、增強掩碼解碼器實現和位置嵌入截斷處理。
jondurbin
百吉餅模型是基於更新後的yi-34b-200k進行微調的版本,具備出色的長上下文支持能力。該模型通過直接偏好優化(DPO)進行了額外調整,在處理長文本時表現更佳,支持多種提示格式和特殊提示策略。
Kooten
無畏女僕-20B-V1.1是基於DaringMaid-20B的升級版本,主要更新是將Noromaid-13b從v0.1.1替換為v0.3版本,並略微提高了Noromaid的權重,以確保更好的兼容性。
Undi95
ReMM-SLERP是對原始MythoMax-L2-13B的重構版本,採用SLERP技術融合了更新後的多個13B參數模型,包括Chronos-Beluga、Airoboros和Huginn等。
sazyou-roukaku
chilled_remix和reversemix是文本到圖像生成模型,專為圖像創作領域設計。它們提供多樣化的圖像生成效果,在版本更新後對使用限制進行了優化,特別適合LORA愛好者使用,能實現更穩定的面部真實感。
一個為開發者提供統一訪問多個庫文檔的MCP服務器,支持文檔聚合、搜索、版本管理和自動更新功能。
一個基於Model Context Protocol (MCP)的Smartsheet API交互服務器,提供搜索、檢索和更新Smartsheet表格的功能,支持版本備份和格式化響應。