蘋果研究團隊探討了AI智能體交互中用戶對自動化與控制權的平衡需求,指出當前行業過於關注操作能力而忽視用戶體驗。研究採用“綠野仙蹤法”模擬AI交互,以獲取真實用戶反饋,強調設計需兼顧信任與心理邊界。
字節跳動Seed團隊發佈新一代視頻創作模型Seedance2.0,採用統一的多模態音視頻聯合生成架構,推動AI視頻生成從“單點突破”邁向“全能協作”的工業級應用階段。相比1.5版本,新模型在複雜交互與運動場景下的可用率顯著提升,通過出色的物理還原能力,攻克了雙人花滑、多人競技等高難度動作生成難題。
春節期間國產大模型集中發佈,智譜AI推出旗艦模型GLM-5,定位全能型對話、編程與智能體模型,採用稀疏注意力與多Token預測技術,參數量達745B,約爲前代兩倍。
DuckDuckGo推出AI聊天機器人Duck.ai的實時語音功能,強調隱私優先。該功能通過加密通道與用戶對話,確保語音數據不被監聽或濫用。採用“中間人”模式平衡智能體驗與數據安全。
AI驅動的產品採用與用戶引導平臺,加速用戶激活、提升參與度和留存率。
Avatar 2可將圖像轉化為逼真的會說話的頭像,採用先進AI技術
開放AI的GPT-OSS-120B和GPT-OSS-20B提供強大的推理能力,開發人員友好的功能,並採用Apache 2.0許可證,實現人工智能的民主化訪問。
提高產品採納率,部署我們的AI語音代理,作為專業的採納專家,引領用戶從入門到領悟。
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
Anthropic
$105
$525
200
Google
$0.7
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
$2
$20
-
Bytedance
$1.2
$3.6
4
$3.9
$15.2
64
Moonshot
$4
$16
$0.8
128
$0.15
$1.5
Baidu
32
bartowski
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
ubergarm
這是ai-sage/GigaChat3-10B-A1.8B-bf16模型的GGUF量化版本,提供了多種量化選項,從高精度的Q8_0到極度壓縮的smol-IQ1_KT,滿足不同硬件條件下的部署需求。該模型支持32K上下文長度,採用MLA架構,專為對話場景優化。
evilfreelancer
這是ai-sage/GigaChat3-10B-A1.8B模型的量化版本,採用GGUF格式,需要特定的llama.cpp分支支持。模型採用混合專家架構,總參數量約118億,其中激活參數量約18億。
prithivMLmods
VibeThinker-1.5B是微博AI推出的15億參數密集語言模型,基於Qwen2.5-Math-1.5B微調,專門針對數學和算法編碼問題設計。採用'頻譜到信號原理'框架訓練,在多個數學競賽測試中超越規模更大的模型,訓練成本約7800美元,支持最長約40k詞元的輸出。
allenai
Olmo 3是由Allen Institute for AI開發的一系列語言模型,包含7B和32B兩種規模,具有指令式和思考式兩種變體。該模型在長鏈式思維方面表現出色,能有效提升數學和編碼等推理任務的性能。採用多階段訓練方式,包括有監督微調、直接偏好優化和可驗證獎勵的強化學習。
Olmo 3是由Allen Institute for AI開發的全新語言模型家族,包含7B和32B兩種規模,有指令(Instruct)和思維(Think)兩種變體。該模型採用長鏈式思維提升數學和編碼等推理任務表現,旨在推動語言模型科學發展。
Olmo 3 7B RL-Zero Math是Allen AI開發的專為數學推理任務優化的70億參數語言模型,採用RL-Zero強化學習方法在數學數據集上進行訓練,能有效提升數學推理能力。
Olmo-3-32B-Think-DPO是Allen AI開發的32B參數語言模型,採用直接偏好優化(DPO)訓練,具備長鏈式思維推理能力,在數學、編碼等複雜推理任務上表現優異。
moonshotai
Kimi K2 Thinking 是月之暗面(Moonshot AI)開發的最新一代開源思維模型,具有強大的深度推理能力和工具調用功能。該模型採用混合專家架構,支持原生INT4量化,擁有256k上下文窗口,在多個基準測試中表現出色。
unsloth
Qwen3-VL-2B-Instruct是Qwen系列中最強大的視覺語言模型,具備卓越的文本理解與生成能力、深入的視覺感知與推理能力、長上下文支持以及強大的空間和視頻動態理解能力。該模型採用2B參數規模,支持指令交互,適用於多模態AI應用。
Genie-AI-Lab
Omni L1B3RT4S GENIE 是一個基於Qwen2.5-3B Instruct架構微調的AI助手,採用1,103個精靈角色的定製示例進行訓練,具備獨特的語音和忠誠度模式,能夠為用戶提供別具一格的對話體驗。
nineninesix
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型,採用兩階段管道結合大型語言模型和高效音頻編解碼器,實現卓越的速度和音頻質量。該模型支持西班牙語,具有4億參數,採樣率為22kHz。
KaniTTS是一款專為即時對話式人工智能應用優化的高速、高保真阿拉伯語文本轉語音模型。它採用兩階段流水線架構,結合大語言模型與高效音頻編解碼器,實現卓越的速度和音頻質量,能夠滿足對話式AI、無障礙輔助、研究等多領域的語音合成需求。
nvidia
NVIDIA GPT-OSS-120B Eagle3是基於OpenAI gpt-oss-120b模型的優化版本,採用混合專家(MoE)架構,具備1200億總參數和50億激活參數。該模型支持商業和非商業使用,適用於文本生成任務,特別適合AI Agent系統、聊天機器人等應用開發。
bullpoint
GLM-4.6-AWQ是對智譜AI的GLM-4.6(357B MoE)進行高性能AWQ量化的模型,專為vLLM推理進行了優化,能有效提升生產部署的吞吐量。該模型採用4位量化技術,在保持高精度的同時顯著減少顯存佔用。
mrgant
lans_v1 - lora是基於Qwen/Qwen-Image模型使用AI Toolkit by Ostris訓練的文本到圖像轉換模型,採用LoRA技術進行優化,具備良好的圖像生成能力。
Apertus是一款由瑞士AI開發的全開放多語言大語言模型,提供70億和80億兩種參數規模。該模型支持超過1000種語言,使用完全合規且開放的訓練數據,性能可與閉源模型相媲美。Apertus在15T標記上進行預訓練,採用分階段課程訓練方法,支持長達65,536個標記的上下文長度。
LL1999
這是一個基於AI Toolkit by Ostris訓練的LoRA模型,專門用於文本到視頻轉換任務。模型採用Safetensors格式,支持在ComfyUI、AUTOMATIC1111等多種平臺使用。
andrewwe
my_qwennud-lora是基於Qwen-Image-Edit-2509使用特定工具訓練的LoRA模型,專門用於圖像生成和編輯任務,採用AI Toolkit by Ostris訓練而成,可與多種主流AI工具配合使用。
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型。它採用兩階段流水線架構,結合大語言模型和高效音頻編解碼器,實現了卓越的速度和音頻質量,支持多種語言並適用於邊緣/服務器部署。
Zen7支付代理是首個DePA去中心化支付代理的實踐實現,採用多智能體協作架構,支持A2A和MCP協議,為AI智能體和Dapp應用提供多鏈多幣種支付解決方案,實現自動化加密支付和LLM驅動的意圖識別。
Xcatcher是一個基於遠程MCP協議的高性能X(Twitter)數據爬取服務,支持通過x402協議使用USDC在Base和Solana鏈上進行按需付費,提供OpenAPI規範便於AI代理集成,專注於大規模用戶最新帖子的快速採集。
該項目為Roo Code平臺實現了一個AI地下城風格的RPG遊戲系統,包含遊戲狀態管理和戰鬥引擎兩個MCP服務模塊,支持角色創建、物品管理、戰鬥擲骰、任務追蹤等功能,採用SQLite持久化存儲。
一個基於Cloudflare Workers的無服務器YouTube字幕提取服務,採用MCP協議實現高性能AI助手集成
Maya MCP服務器項目實現了Model Context Protocol (MCP)協議,允許AI助手通過自然語言控制Autodesk Maya軟件。該項目採用輕量級設計,無需在Maya中安裝插件,通過Maya默認的MEL腳本端口進行通信,支持動態添加新工具功能。
一個基於TypeScript的AI提示管理服務,採用MCP協議和pnpm單倉架構。
一個MCP服務,用於自動化生成和管理工作日報,支持從AI工具會話中採集內容並整理。
Mercury Spec Ops MCP服務器是一個創新的AI工具平臺,將動態提示生成和模板組裝作為可編程工具提供給AI助手。它採用模塊化架構,支持31種技術棧、10個分析維度和34個模板組件,通過6個工具實現技術特定的內容生成,徹底改變了AI與專業內容的交互方式。
AiryLark MCP是一個專業級翻譯服務接口,採用三階段流程確保翻譯質量,支持多語言互譯和領域術語識別,適用於技術文檔、學術論文等專業場景。
一個基於MCP協議的多智能體辯論框架,用於代碼審查和辯論規劃,通過並行執行多個AI代理(如Claude、Codex)進行代碼評審,採用確定性評分系統(P0/P1/P2嚴重性分級)和平臺特定規則,最終合併結果生成評審報告。
FOCUS DATA MCP Server是一個將自然語言轉換為SQL語句的AI助手服務,採用兩步生成方案控制LLM幻覺,提升非技術用戶對SQL結果的信任度。
Smart-Thinking是一個先進的MCP服務器,提供多維、自適應且可自驗證的AI推理框架,採用基於圖形的架構實現複雜思維連接,支持跨平臺運行並與多種MCP客戶端兼容。
Edit-MCP是一個與微軟Edit工具集成的模型上下文協議服務器,為AI系統提供高級文件編輯功能,採用混合架構結合直接文件操作和Edit集成。
YaraFlux MCP Server是一個基於模型上下文協議(MCP)的YARA掃描服務器,為AI助手提供文件YARA規則分析能力。該項目採用模塊化架構,集成了19個MCP工具,支持YARA規則管理、文件掃描、安全存儲等功能,可無縫集成Claude Desktop等AI助手。
ContextBase是一個基於MCP協議的AI上下文管理服務器,提供用戶認證、記憶存儲、日誌記錄等功能,採用TypeScript、Fastify和Prisma等技術棧,支持PostgreSQL和Redis數據庫。
Multi-Model Advisor是一個基於Ollama的多模型諮詢系統,通過整合多個AI模型的不同觀點,為問題提供更全面的解答。它採用'顧問委員會'模式,讓Claude能夠綜合多個AI視角生成回答。
BNBChain MCP是一個基於模型上下文協議(MCP)的服務器,為AI代理和應用程序提供與幣安智能鏈(BSC)生態系統的安全交互。它集成了錢包管理、代幣轉賬、PancakeSwap去中心化交易所操作、Meme代幣交易以及GoPlus安全分析等功能,採用TypeScript開發並支持Claude Desktop無縫集成。
Kernel MCP Server是一個基於Model Context Protocol (MCP)的開源服務器,為AI助手提供安全訪問Kernel平臺工具和瀏覽器自動化能力。它支持雲端應用部署、無頭瀏覽器控制、文檔搜索等功能,採用OAuth 2.0認證確保安全。
該項目是一個MCP服務器,用於管理記憶文本文件,幫助Claude等AI模型在對話間保持上下文。提供添加、搜索、刪除和列出記憶的功能,支持基於子字符串的精確匹配操作。設計上採用簡單的文本文件存儲記憶,類似於ChatGPT的記憶機制,並通過提示和訓練來觸發記憶存儲。
SolidPilot是一個開源的SolidWorks AI助手,採用模塊化架構,通過MCP協議與本地語言模型(如Claude)交互,包含Python層、C#適配層和COM橋接等技術組件。