小米宣佈將自研大模型MiMo-V2-Flash的公測限免期延長20天,至2026年1月20日。該模型參數量達3090億,激活參數150億,在推理和代碼生成方面表現優異。此舉旨在爲用戶提供更長的體驗時間,並展現小米在AI領域的持續投入與信心。
MiniMax開源M2.1編程模型,已在Hugging Face、ModelScope和GitHub上線,方便開發者接入。該模型獲vLLM“Day-0”支持,可立即實現高效推理,並通過KTransformers技術優化性能。
YuanLab.ai發佈開源多模態大模型Yuan3.0Flash,參數規模達40B,採用稀疏混合專家架構,推理時僅激活約3.7B參數,顯著提升效率。模型提供16bit與4bit權重、技術報告及訓練方法,支持二次開發和行業定製,推動AI技術普及。
夸克AI眼鏡於12月31日完成首次OTA升級,新增錄音紀要、圖文備忘錄、多意圖理解與執行、藍環支付及社區服務五大功能,並對翻譯、行程查詢等既有功能進行優化。通過自研語音增強模型與硬件配置,其錄音功能現支持十米範圍清晰收音與有效降噪。
一個API連接所有頂尖AI模型,高性能且性價比高,支持多類型生成。
免費無限AI圖片視頻生成器,無需註冊,支持多模型,即時創作作品。
一體化AI創作平臺,集成20+前沿模型,支持圖、文、音創作
免費AI音樂生成器,用先進模型將文本瞬間轉為專業音樂
Google
$0.49
輸入tokens/百萬
$2.1
輸出tokens/百萬
1k
上下文長度
Openai
$2.8
$11.2
Xai
$1.4
$3.5
2k
$7.7
$30.8
200
-
Anthropic
$105
$525
$0.7
$7
$35
$17.5
$21
Alibaba
$1
$10
256
$6
$24
$2
$20
$4
$16
Baidu
128
Bytedance
$1.2
$3.6
4
RinggAI
這是一個專為通話記錄分析打造的混合語言AI模型,能夠處理印地語、英語和混合印地英語的通話轉錄內容。模型基於Qwen2.5-1.5B-Instruct進行微調,具備強大的多語言理解和信息提取能力。
prithivMLmods
Olmo-3-7B-Instruct-AIO-GGUF是基於Allen Institute for AI開發的Olmo-3-7B-Instruct模型的GGUF量化版本。這是一個70億參數的自迴歸語言模型,通過監督微調和直接偏好優化在Tulu 2和UltraFeedback等數據集上訓練,在問答和指令遵循方面表現出色。
bartowski
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
DevQuasar
這是 ai-sage/GigaChat3-702B-A36B-preview-bf16 模型的量化版本,旨在為大眾提供免費的知識獲取途徑。該模型是一個大型語言模型,專注於文本生成任務。
evilfreelancer
這是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,採用GGUF格式,需要特定的llama.cpp分支支持。模型採用混合專家架構,總參數量約118億,其中激活參數量約18億。
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
allenai
Olmo 3是由Allen Institute for AI開發的新一代語言模型家族,包含7B和32B的指令和思維變體。該模型在長鏈式思維方面表現出色,能顯著提升數學和編碼等推理任務的性能。所有代碼、檢查點和訓練細節都將公開,推動語言模型科學發展。
Olmo 3是由Allen Institute for AI開發的新一代語言模型系列,包含7B和32B兩種規模,有指令和思考兩種變體。該模型基於Dolma 3數據集進行預訓練,在Dolci數據集上進行後訓練,具備長鏈式思維能力,在數學和編碼等推理任務上表現優異。
XiaomiMiMo
米模具身模型(MiMo-Embodied)是一款強大的跨具身視覺語言模型,在自動駕駛和具身AI任務中均展現出了卓越的性能。它是首個將這兩個關鍵領域相結合的開源視覺語言模型,顯著提升了在動態物理環境中的理解和推理能力。
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
Olmo-3-7B-Think-DPO是Allen Institute for AI開發的7B參數語言模型,具有長鏈式思考能力,在數學和編碼等推理任務中表現出色。該模型經過監督微調、直接偏好優化和基於可驗證獎勵的強化學習等多階段訓練,專為研究和教育用途設計。
Olmo 3是由Allen Institute for AI (Ai2)開發的一系列語言模型,包含7B和32B兩種規格,有Instruct和Think兩種變體。該模型基於Transformer架構,具有長鏈思維能力,可有效提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的開源語言模型系列,包含7B和32B兩種規格,分為指令(Instruct)和思考(Think)兩種變體。該模型具有出色的長鏈思維能力,能夠顯著提升數學和編碼等推理任務的表現。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
Olmo 3 7B RL-Zero Math是Allen AI開發的專為數學推理任務優化的70億參數語言模型,採用RL-Zero強化學習方法在數學數據集上進行訓練,能有效提升數學推理能力。
Olmo 3 7B RL-Zero Mix是Allen AI開發的7B參數規模的語言模型,屬於Olmo 3系列。該模型在Dolma 3數據集上進行預訓練,在Dolci數據集上進行後訓練,並通過強化學習優化數學、編碼和推理能力。
DakkaWolf
Trouper-12B GGUF是由DarwinAnim8or基於原始模型開發的文本生成模型,專門針對角色扮演和創意寫作場景進行了優化。該模型從Mistral-Nemo-Base-12B微調而來,使用了自定義的'Actors'數據集進行訓練,生成的文本更加自然,避免了常見的'AI語言'特徵。
Olmo-3-32B-Think-DPO是Allen AI開發的32B參數語言模型,採用直接偏好優化(DPO)訓練,具備長鏈式思維推理能力,在數學、編碼等複雜推理任務上表現優異。
這是一個基於Moonshot AI技術的量化版本模型,專注於視覺語言理解與生成任務,致力於降低知識獲取門檻,讓知識為每個人所用。
Klavis AI是一個開源項目,提供在Slack、Discord和Web平臺上簡單易用的MCP(模型上下文協議)服務,包括報告生成、YouTube工具、文檔轉換等多種功能,支持非技術用戶和開發者使用AI工作流。
一個MCP服務器,將AI模型與WinDbg/CDB集成,用於分析Windows崩潰轉儲文件和進行遠程調試,支持自然語言交互執行調試命令。
PG-MCP是一個為PostgreSQL數據庫設計的模型上下文協議服務器,提供AI代理發現、連接、查詢和理解數據庫的API,支持多數據庫連接、豐富的目錄信息和查詢解釋功能。
Genkit是一個用於構建AI驅動應用的開源框架,提供Node.js和Go庫,支持多種AI模型和向量數據庫集成,包含開發工具和插件生態系統。
HiveChat是一個專為中小團隊設計的AI聊天應用,支持多種大模型服務商,提供分組管理、Token限額、第三方登錄等功能。
UnityMCP是一個Unity編輯器插件,實現模型上下文協議(MCP),提供Unity與AI助手的無縫集成,包括即時狀態監控、遠程命令執行和日誌功能。
Supabase MCP Server是一個連接Supabase項目與AI助手的工具,通過Model Context Protocol(MCP)標準化大型語言模型(LLMs)與外部服務的交互,實現數據庫管理、配置獲取和數據查詢等功能。
OpenDia是一款開源瀏覽器擴展工具,允許AI模型直接控制用戶瀏覽器,利用現有登錄狀態、書籤等數據進行自動化操作,支持多種瀏覽器和AI模型,注重隱私保護。
微軟官方MCP服務器集合,提供Azure、GitHub、Microsoft 365、Fabric等多種服務的AI助手集成工具,支持本地和遠程部署,幫助開發者通過標準化協議連接AI模型與各類數據源和工具。
Zen MCP是一個多模型AI協作開發服務器,為Claude和Gemini CLI等AI編碼助手提供增強的工作流工具和跨模型上下文管理。它支持多種AI模型的無縫協作,實現代碼審查、調試、重構等開發任務,並能保持對話上下文在不同工作流間的延續。
MCP Atlassian是一個為Atlassian產品(Confluence和Jira)設計的模型上下文協議服務器,支持雲端和本地部署,提供AI助手集成功能。
Claude Context是一個MCP插件,通過語義代碼搜索為AI編程助手提供整個代碼庫的深度上下文,支持多種嵌入模型和向量數據庫,實現高效代碼檢索。
一個基於Python的MCP服務器,通過Notion API提供高級待辦事項管理和內容組織功能,實現AI模型與Notion的無縫集成。
Notion MCP服務器是一個通過官方SDK連接AI模型與Notion工作區的協議服務,提供全面的Notion操作工具集。
Perplexity MCP Server是一個智能研究助手,利用Perplexity的AI模型自動分析查詢複雜度並選擇最佳模型處理請求,支持搜索、推理和深度研究三種工具。
PAELLADOC是一個AI優先的開發框架,通過實現模型上下文協議(MCP)和五大哲學原則,徹底改變了AI時代的軟件開發方式。
Godot MCP是一個為Godot遊戲引擎設計的模型上下文協議服務器,提供編輯器控制、項目運行、調試輸出捕獲等功能,支持AI助手與Godot引擎的交互。
Nexus是一個AI工具聚合網關,支持連接多個MCP服務器和LLM提供商,通過統一端點提供工具搜索、執行和模型路由功能,支持安全認證和速率限制。
Mapbox MCP服務器是一個Node.js實現的模型上下文協議服務器,為AI應用提供Mapbox地理空間API的訪問能力,包括地理編碼、興趣點搜索、路線規劃、等時線分析和靜態地圖生成等功能。
Wren Engine是一個為MCP客戶端和AI代理設計的語義引擎,提供語義層支持,使AI能準確理解企業數據模型和業務邏輯。它支持多種數據源,嵌入MCP客戶端,確保數據交互的精確性和治理。