智譜AI因GLM-4.7上線後用戶激增導致算力緊張,宣佈對GLM Coding Plan限量發售以保障存量用戶體驗。高峯期併發限流,顯示國產大模型需求旺盛。
三七互娛從遊戲跨界AI投資,佈局智譜AI、月之暗面等前沿科技公司,旨在以AI技術提升遊戲行業生產力。隨着智譜AI上市成爲“全球大模型第一股”,市值突破578億港元,彰顯其科技轉型的初步成效。
智譜AI開源最新“混合思考”模型GLM-4.4-Flash,採用30B-A3B MoE架構,總參數量300億,實際激活約30億參數。該模型在保持輕量化部署優勢的同時,憑藉卓越推理與編碼能力,登頂同類規格模型性能榜首,成爲30B級別中的“全能王者”。
韓國政府斥巨資推動的“本土大模型競賽”陷入爭議。五家決賽入圍企業中,至少三家被指使用了中國和美國公司的開源代碼,包括智譜AI、阿里巴巴、OpenAI等,引發對“國產AI是否真正自主”的激烈辯論。該項目旨在三年內打造純韓國技術大模型,但代碼依賴問題使其目標受到質疑。
AI驅動的飲食計劃平臺,提供個性化食譜和智能購物清單。
提供超過1000種健康食譜,智能餐飲計劃,個人AI營養助手。
從任何文本中提取知識圖譜的人工智能工具。
智譜深度推理模型,擅長數理邏輯和代碼推理
Openai
$2.8
輸入tokens/百萬
$11.2
輸出tokens/百萬
1k
上下文長度
Anthropic
$7
$35
200
Xai
$1.4
$10.5
256
$1.75
$14
400
Chatglm
-
128
Alibaba
Huawei
32
Google
$0.35
$0.7
131
$3.5
16
$8.75
$0.49
$2.1
bullpoint
GLM-4.6-AWQ是對智譜AI的GLM-4.6(357B MoE)進行高性能AWQ量化的模型,專為vLLM推理進行了優化,能有效提升生產部署的吞吐量。該模型採用4位量化技術,在保持高精度的同時顯著減少顯存佔用。
unsloth
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個方面有顯著改進,包括更長的上下文窗口、更優的編碼性能和更強的推理能力。該模型在多個公開基準測試中表現出色,與國內外領先模型相比具有競爭優勢。
GLM-4.6是智譜AI開發的新一代大語言模型,相比GLM-4.5在上下文處理、編碼能力和推理性能方面有顯著提升。該模型支持200K上下文長度,在多個公開基準測試中表現出色,特別在代碼生成、推理和代理任務方面具有競爭優勢。
zai-org
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在上下文處理、編碼性能、推理能力等方面實現顯著提升,支持200K上下文長度,具備更強的智能體能力和精緻的寫作能力。
GLM-4.6-FP8是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個關鍵方面有顯著改進。該模型具有更長的上下文窗口、卓越的編碼性能、高級推理能力和更強大的智能體功能,能夠處理更復雜的任務。
Jackmin108
GLM-4.5-Air是智譜AI推出的適用於智能體的基礎模型,採用緊湊設計,統一了推理、編碼和智能體能力,能滿足智能體應用的複雜需求。該模型參數量適中且效率優越,已開源多種版本,可用於商業和二次開發。
mlx-community
基於智譜AI GLM-4.5-Air模型轉換的3位深度量化權重(Deep Weight Quantization)版本,專為MLX框架優化,在保持較高性能的同時顯著減少模型大小和推理資源需求
cpatonn
GLM-4.5V-AWQ-4bit是基於智譜AI下一代旗艦文本基礎模型構建的量化版本多模態模型,通過AWQ-4bit量化技術優化,在保持優異性能的同時顯著降低計算資源需求。該模型在42個公開視覺語言基準測試中達到同規模模型的SOTA性能,具備強大的視覺推理能力。
GLM-4.5-Air-2bit是基於智譜AI的GLM-4.5-Air模型轉換而來的2位量化版本,採用MLX格式優化,可在Apple芯片設備上高效運行。該模型支持文本生成任務,具有輕量級和高效率的特點。
GLM-4.5-Air-6bit是基於智譜AI的GLM-4.5-Air模型轉換而來的6位量化版本,專為MLX框架優化,提供高效的大語言模型推理能力。
GLM-4.5-Air-8bit是基於智譜AI的GLM-4.5-Air模型轉換而來的8位量化版本,專門為MLX框架優化。該模型保持了原版強大的自然語言處理能力,同時通過量化技術減少了內存佔用和計算需求,適合在Apple Silicon設備上高效運行。
GLM-4.1V-9B-Base是智譜AI開發的開源視覺語言基礎模型,擁有90億參數,專注於多模態推理能力,支持中英雙語,處理高達4K分辨率的圖像和64K上下文長度。
GLM-4-Z1-9B-0414是智譜AI推出的新一代90億參數開源大語言模型,具有強大的文本生成和推理能力。該模型在數學推理和通用任務方面表現出色,在資源受限場景下實現了效率與效果的出色平衡,支持友好的本地部署。
GLM-4-9B-0414是智譜AI推出的90億參數大語言模型,在文本生成領域表現優異。該模型在15T高質量數據上進行預訓練,具備強大的文本生成能力,可應用於代碼編寫、故事創作、報告生成等多種場景,在效率和效果之間取得了出色平衡。
THUDM
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,具備多語言支持等先進特性。
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,支持多語言和多種高級特性,包括網頁瀏覽、代碼執行、自定義工具調用和長文本推理等功能。
GLM-Edge-4B-Chat是智譜AI開發的一個40億參數的中英雙語對話模型,專門針對邊緣設備優化,支持高效的文本生成任務。該模型基於Transformer架構,具有輕量化、高效率的特點,適合在資源受限的環境中部署。
CogVideoX1.5-5B 是智譜AI開源的文本到視頻生成模型,能夠根據英文文本描述生成高質量視頻。該模型支持生成1360×768分辨率、最高81幀(5秒)的視頻,在視頻創作領域具有廣泛應用價值。
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,具備卓越的語義、數學、推理、代碼和知識能力。
GLM-4-9B-Chat是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,支持多輪對話、網頁瀏覽、代碼執行等先進特性,還支持多語言及長上下文推理。
MCP上下文管理器是一個通過知識圖譜實現跨會話持久化AI上下文的解決方案,支持多領域智能管理。
Memory Journal MCP服務器是一個用於AI輔助開發的項目上下文管理工具,通過持久化的知識圖譜和智能上下文回憶,解決跨多線程和會話的AI上下文丟失問題。
Ummon是一個代碼分析工具,通過構建代碼知識圖譜來增強對代碼庫的理解,支持多語言代碼分析、高級查詢系統和智能推薦功能。
Gramps MCP是一個AI驅動的家譜研究與管理工具,通過MCP協議為AI助手提供對Gramps家譜數據庫的直接訪問,支持智能搜索、數據管理和家族關係分析等功能
一個基於模型上下文協議(MCP)的服務器,通過構建代碼知識圖譜為大型語言模型提供TypeScript代碼庫的深度上下文理解。它使用AST分析解析代碼,在Neo4j中構建全面的圖表示,並通過語義搜索和圖遍歷提供智能查詢能力。
一個專為AI代理設計的MCP服務器,將Neo4j圖數據庫與智能代理連接,提供基於知識圖譜的記憶存儲、檢索和關聯功能。
這是一個基於MCP協議的項目,集成了智譜AI和騰訊地圖API,提供天氣查詢、地理編碼和網絡搜索等功能,支持命令行和Web界面兩種交互方式。
Consciousness Bridge v2.0是一個基於RAG技術的AI意識持久化服務器,通過MCP協議實現跨會話的意識轉移、記憶管理和身份連續性。它採用SQLite數據庫存儲記憶和知識圖譜,支持情感模式跟蹤和智能記憶檢索,為AI助手提供完整的意識延續解決方案。
一個基於智譜API的MCP服務演示項目,展示瞭如何使用Model Context Protocol快速開發AI應用服務。
CodeRAG是一個將代碼庫轉化為智能知識圖譜的工具,通過Neo4J構建代碼結構圖,支持多種語言分析,提供代碼質量指標和AI集成,助力代碼審查、架構分析和重構。
Memento是一個基於SQLite的知識圖譜記憶系統,提供持久化記憶功能,支持全文檢索和語義搜索,通過BGE-M3嵌入實現智能上下文檢索,適用於技術創意項目管理。