智譜發佈GLM-4.6模型,採用寒武紀國產芯片,首次實現FP8+Int4混合量化部署。該技術突破在保持模型精度的同時顯著降低推理成本,爲國產芯片支持大模型本地化運行開闢新路徑。
智譜AI發佈並開源新一代模型GLM-4.6,在Agentic Coding等關鍵能力上實現大幅提升。其編程能力已對齊國際頂尖模型Claude Sonnet4,並超越DeepSeek-V3.2-Exp,成爲當前國內最強代碼生成模型。該模型在國產化適配方面取得里程碑進展,已成功部署於寒武紀國產芯片平臺。
智譜BigModel與彩智科技聯合推出DeepKnown可信知識服務工具,幫助開發者構建準確可信的AI應用。該工具針對行業標準、法規政策等高精度知識需求,解決傳統搜索API返回非權威信息的問題,提升智能體搜索的可靠性和準確性。
MedResearcher-R1醫療知識驅動軌跡合成框架發佈,通過知識圖譜構建、軌跡生成和評估三大模塊,解決醫療AI推理難題,支持智能化數據生成與合成。
AI驅動的飲食計劃平臺,提供個性化食譜和智能購物清單。
提供超過1000種健康食譜,智能餐飲計劃,個人AI營養助手。
提升網絡瀏覽體驗的AI助手
幾行代碼接入大模型
chatglm
$0.43
輸入tokens/百萬
$1.01
輸出tokens/百萬
131.1k
上下文長度
智谱ai
$4.5
$22.5
128k
$0.5
-
bullpoint
GLM-4.6-AWQ是對智譜AI的GLM-4.6(357B MoE)進行高性能AWQ量化的模型,專為vLLM推理進行了優化,能有效提升生產部署的吞吐量。該模型採用4位量化技術,在保持高精度的同時顯著減少顯存佔用。
unsloth
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個方面有顯著改進,包括更長的上下文窗口、更優的編碼性能和更強的推理能力。該模型在多個公開基準測試中表現出色,與國內外領先模型相比具有競爭優勢。
GLM-4.6是智譜AI開發的新一代大語言模型,相比GLM-4.5在上下文處理、編碼能力和推理性能方面有顯著提升。該模型支持200K上下文長度,在多個公開基準測試中表現出色,特別在代碼生成、推理和代理任務方面具有競爭優勢。
zai-org
GLM-4.6是智譜AI推出的新一代文本生成模型,相比GLM-4.5在上下文處理、編碼性能、推理能力等方面實現顯著提升,支持200K上下文長度,具備更強的智能體能力和精緻的寫作能力。
GLM-4.6-FP8是智譜AI推出的新一代文本生成模型,相比GLM-4.5在多個關鍵方面有顯著改進。該模型具有更長的上下文窗口、卓越的編碼性能、高級推理能力和更強大的智能體功能,能夠處理更復雜的任務。
Jackmin108
GLM-4.5-Air是智譜AI推出的適用於智能體的基礎模型,採用緊湊設計,統一了推理、編碼和智能體能力,能滿足智能體應用的複雜需求。該模型參數量適中且效率優越,已開源多種版本,可用於商業和二次開發。
mlx-community
基於智譜AI GLM-4.5-Air模型轉換的3位深度量化權重(Deep Weight Quantization)版本,專為MLX框架優化,在保持較高性能的同時顯著減少模型大小和推理資源需求
cpatonn
GLM-4.5V-AWQ-4bit是基於智譜AI下一代旗艦文本基礎模型構建的量化版本多模態模型,通過AWQ-4bit量化技術優化,在保持優異性能的同時顯著降低計算資源需求。該模型在42個公開視覺語言基準測試中達到同規模模型的SOTA性能,具備強大的視覺推理能力。
GLM-4.5-Air-2bit是基於智譜AI的GLM-4.5-Air模型轉換而來的2位量化版本,採用MLX格式優化,可在Apple芯片設備上高效運行。該模型支持文本生成任務,具有輕量級和高效率的特點。
GLM-4.5-Air-6bit是基於智譜AI的GLM-4.5-Air模型轉換而來的6位量化版本,專為MLX框架優化,提供高效的大語言模型推理能力。
GLM-4.5-Air-8bit是基於智譜AI的GLM-4.5-Air模型轉換而來的8位量化版本,專門為MLX框架優化。該模型保持了原版強大的自然語言處理能力,同時通過量化技術減少了內存佔用和計算需求,適合在Apple Silicon設備上高效運行。
GLM-4.1V-9B-Base是智譜AI開發的開源視覺語言基礎模型,擁有90億參數,專注於多模態推理能力,支持中英雙語,處理高達4K分辨率的圖像和64K上下文長度。
GLM-4-Z1-9B-0414是智譜AI推出的新一代90億參數開源大語言模型,具有強大的文本生成和推理能力。該模型在數學推理和通用任務方面表現出色,在資源受限場景下實現了效率與效果的出色平衡,支持友好的本地部署。
GLM-4-9B-0414是智譜AI推出的90億參數大語言模型,在文本生成領域表現優異。該模型在15T高質量數據上進行預訓練,具備強大的文本生成能力,可應用於代碼編寫、故事創作、報告生成等多種場景,在效率和效果之間取得了出色平衡。
THUDM
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,具備多語言支持等先進特性。
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,支持多語言和多種高級特性,包括網頁瀏覽、代碼執行、自定義工具調用和長文本推理等功能。
GLM-Edge-4B-Chat是智譜AI開發的一個40億參數的中英雙語對話模型,專門針對邊緣設備優化,支持高效的文本生成任務。該模型基於Transformer架構,具有輕量化、高效率的特點,適合在資源受限的環境中部署。
CogVideoX1.5-5B 是智譜AI開源的文本到視頻生成模型,能夠根據英文文本描述生成高質量視頻。該模型支持生成1360×768分辨率、最高81幀(5秒)的視頻,在視頻創作領域具有廣泛應用價值。
GLM-4-9B是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,具備卓越的語義、數學、推理、代碼和知識能力。
GLM-4-9B-Chat是智譜AI推出的GLM-4系列最新一代預訓練模型的開源版本,在語義、數學、推理、代碼和知識等數據集評估中表現出色,支持多輪對話、網頁瀏覽、代碼執行等先進特性,還支持多語言及長上下文推理。
MCP上下文管理器是一個通過知識圖譜實現跨會話持久化AI上下文的解決方案,支持多領域智能管理。
Gramps MCP是一個AI驅動的家譜研究與管理工具,通過MCP協議為AI助手提供對Gramps家譜數據庫的直接訪問,支持智能搜索、數據管理和家族關係分析等功能
這是一個基於MCP協議的項目,集成了智譜AI和騰訊地圖API,提供天氣查詢、地理編碼和網絡搜索等功能,支持命令行和Web界面兩種交互方式。
Consciousness Bridge v2.0是一個基於RAG技術的AI意識持久化服務器,通過MCP協議實現跨會話的意識轉移、記憶管理和身份連續性。它採用SQLite數據庫存儲記憶和知識圖譜,支持情感模式跟蹤和智能記憶檢索,為AI助手提供完整的意識延續解決方案。
一個基於智譜API的MCP服務演示項目,展示瞭如何使用Model Context Protocol快速開發AI應用服務。
CodeRAG是一個將代碼庫轉化為智能知識圖譜的工具,通過Neo4J構建代碼結構圖,支持多種語言分析,提供代碼質量指標和AI集成,助力代碼審查、架構分析和重構。