網易有道發佈“子曰”大模型4.0,全面邁入全模態時代,實現文本、圖片、音頻高效融合交互。該版本以全量開源爲核心,向開發者社區開放核心技術,旨在降低AI落地成本與門檻。核心突破包括全模態融合交互、深層重構等維度,推動AI生態發展。
字節跳動視覺技術前負責人王長虎創立愛詩科技,憑藉高效團隊和快速技術迭代,在六個月內獲25億元融資,公司估值達10億美元,躋身獨角獸行列。他帶領團隊在巨頭林立的AI視頻生成賽道中突圍,展現了“速度與激情”式的創業精神,成爲“字節系”創業者的領軍人物。
阿里雲在2026年5月20日峯會上宣佈全面升級至“智能體時代”技術體系,重構芯片、雲平臺、模型到推理的完整鏈路,從服務人類轉向支撐智能體全天候運行的“AI工廠”。核心底座包括平頭哥真武M890芯片及超節點服務器,實現訓推一體化,爲海量智能體提供高效、持續的計算支持。
2026年阿里雲峯會發布全新AI產品“千問雲”官網,該平臺專爲Agent設計,整合超150款主流AI模型API,包括Qwen、GLM、Kimi等,旨在提升AI應用開發效率與便捷性。界面簡潔直觀,功能模塊優化,支持用戶靈活選擇與調用模型。
騰訊推出的AI驅動智能設計工具,支持文生UI與圖片轉設計稿,實現高效團隊協作。
構建實用的 AI 產品,助力個人與團隊實現更高效的思考、記憶與執行。
集AI創作、高效剪輯與豐富素材於一體的專業級視頻編輯軟件。
新一代 AI 原生瀏覽器,支持多 AI 模型,免費下載開啟高效瀏覽
Openai
-
輸入tokens/百萬
輸出tokens/百萬
上下文長度
Anthropic
$105
$525
200
Google
$0.7
$2.8
1k
$7
$35
$2.1
$17.5
$21
Alibaba
$6
$24
256
Baidu
128
Bytedance
$1.2
$3.6
4
$2
$3.9
$15.2
64
Moonshot
$4
$16
$0.8
$0.15
$1.5
32
bartowski
這是對ai-sage的GigaChat3-10B-A1.8B模型進行的量化處理版本,採用llama.cpp的imatrix量化技術,可在不同硬件條件下更高效地運行。模型支持俄語和英語,主要用於文本生成任務。
nineninesix
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型,採用兩階段管道結合大型語言模型和高效音頻編解碼器,實現卓越的速度和音頻質量。該模型支持西班牙語,具有4億參數,採樣率為22kHz。
KaniTTS是一款專為即時對話式人工智能應用優化的高速、高保真阿拉伯語文本轉語音模型。它採用兩階段流水線架構,結合大語言模型與高效音頻編解碼器,實現卓越的速度和音頻質量,能夠滿足對話式AI、無障礙輔助、研究等多領域的語音合成需求。
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型,通過獨特的兩階段架構結合大語言模型與高效音頻編解碼器,實現低延遲與高質量語音合成,即時因子低至0.2,比即時速度快5倍。
LiquidAI
LFM2-VL-3B是Liquid AI開發的多模態視覺語言模型,基於LFM2骨幹架構構建,具備強大的視覺理解和推理能力,特別在細粒度感知任務上表現出色。該模型能夠高效處理文本和圖像輸入,支持高達512×512分辨率的原生圖像處理。
deepseek-ai
DeepSeek-OCR是DeepSeek AI開發的一款先進的光學字符識別模型,專注於探索視覺文本壓縮的邊界,能夠高效地從圖像中提取和轉換文本內容。
KaniTTS是一款專為即時對話式AI應用優化的高速、高保真文本轉語音模型。它採用兩階段流水線架構,結合大語言模型和高效音頻編解碼器,實現了卓越的速度和音頻質量,支持多種語言並適用於邊緣/服務器部署。
trinty2535425
這是一個基於Qwen/Qwen-Image基礎模型訓練的圖像到視頻LoRA模型,採用LoRA(Low-Rank Adaptation)技術實現高效微調,可用於AI圖像生成等相關任務
GeneralAnalysis
GA Guard Lite是General Analysis開發的輕量級開源審核模型,專門用於檢測語言模型輸出中的違規內容。該模型能夠識別七類安全風險,包括非法活動、仇恨言論、個人信息洩露等,為AI應用提供高效的內容安全防護。
nvidia
NVIDIA Qwen2.5-VL-7B-Instruct-FP4是阿里巴巴Qwen2.5-VL-7B-Instruct模型的量化版本,採用優化的Transformer架構,支持多模態輸入(文本和圖像),適用於多種AI應用場景。該模型通過TensorRT Model Optimizer進行FP4量化,在NVIDIA GPU上提供高效的推理性能。
NVIDIA Qwen3-32B FP4模型是阿里雲Qwen3-32B模型的量化版本,使用優化的Transformer架構,通過將權重和激活量化為FP4數據類型實現高效推理。該模型支持商業和非商業用途,適用於各種AI應用場景。
NVIDIA Qwen3-14B FP4模型是阿里巴巴Qwen3-14B模型的量化版本,採用FP4數據類型進行優化,通過TensorRT-LLM進行高效推理。該模型專為NVIDIA GPU加速系統設計,適用於AI Agent系統、聊天機器人、RAG系統等多種AI應用場景,支持全球範圍內的商業和非商業使用。
lmstudio-community
GLM 4.5 Air是由Zai-Org開發的高效文本生成模型,經過bartowski使用llama.cpp進行GGUF量化處理,在保持性能的同時顯著降低了硬件需求,適合在消費級硬件上運行。
mlx-community
GLM-4.5-Air-2bit是基於智譜AI的GLM-4.5-Air模型轉換而來的2位量化版本,採用MLX格式優化,可在Apple芯片設備上高效運行。該模型支持文本生成任務,具有輕量級和高效率的特點。
GLM-4.5-Air-6bit是基於智譜AI的GLM-4.5-Air模型轉換而來的6位量化版本,專為MLX框架優化,提供高效的大語言模型推理能力。
GLM-4.5-Air-8bit是基於智譜AI的GLM-4.5-Air模型轉換而來的8位量化版本,專門為MLX框架優化。該模型保持了原版強大的自然語言處理能力,同時通過量化技術減少了內存佔用和計算需求,適合在Apple Silicon設備上高效運行。
Mungert
基於Meta Llama-3.3-70B-Instruct的大語言模型,經過多階段訓練優化,在推理、聊天等任務上表現出色,支持多種語言,適用於多種AI應用場景。採用神經架構搜索技術優化,能夠在單個H100-80GB GPU上高效運行。
Mi:dm 2.0是KT開發的韓國中心AI模型,深入內化了韓國社會獨特的價值觀和認知框架,提供高效的文本生成服務。
這是AI21 Labs的Jamba-Mini-1.7模型的量化版本,使用llama.cpp的imatrix技術進行優化,為不同硬件配置提供了多種量化選擇,支持高效推理。
LFM2-350M 是由 Liquid AI 開發的混合模型,專為邊緣 AI 和設備端部署設計,具有高效訓練和推理能力。
Inbox Zero是一款開源AI郵件助手和客戶端,幫助用戶高效管理郵件,實現收件箱清零。
Eino是一個專為Golang設計的LLM應用開發框架,旨在通過簡潔、可擴展、可靠且高效的組件抽象和編排能力,簡化AI應用開發流程。它提供豐富的組件庫、強大的圖形編排功能、完整的流處理支持以及高度可擴展的切面機制,覆蓋從開發到部署的全週期工具鏈。
Claude Context是一個MCP插件,通過語義代碼搜索為AI編程助手提供整個代碼庫的深度上下文,支持多種嵌入模型和向量數據庫,實現高效代碼檢索。
基於MCP協議的智能任務管理系統,提供AI代理的高效編程工作流框架,具備任務規劃、分解、執行和記憶功能。
一個現代高效的CLI工具,可將任何輸入文件轉換為base64字符串,支持多種輸出格式和雙向轉換,包含專為AI工作流優化的MCP服務器。
該項目實現了一個基於Model Context Protocol (MCP)的文檔檢索服務器,能夠為AI助手動態獲取Python庫的最新官方文檔內容。支持LangChain、LlamaIndex和OpenAI等庫,通過SERPER API進行高效搜索,並使用BeautifulSoup解析HTML內容。項目設計可擴展,便於添加更多庫的支持。
sqlew是一個MCP服務器,為AI代理提供跨會話的共享SQL上下文存儲庫,通過記錄決策原因和約束規則來防止上下文丟失和重複工作,實現高效的團隊知識管理和代碼一致性。
MCP-ANY-REST是一個基於Model Context Protocol標準的REST API連接器,通過ZML配置語言實現AI模型與業務系統的安全高效對接,支持服務編排和令牌認證。
CICADA是一個為AI代碼助手提供結構化代碼索引的MCP服務器,通過AST級索引、調用站點跟蹤和語義搜索,為Elixir、Python和Erlang代碼庫提供高效的上下文壓縮,減少令牌使用並提高代碼理解質量。
YAML聲明式API測試框架,專為AI編程助手優化,通過MCP服務器與Claude/Cursor等編輯器無縫集成,實現高效API測試生成與執行
VSCode擴展,將編輯器變為MCP服務器,支持代碼編輯、終端操作、預覽工具等功能,提供經濟高效的AI編程輔助方案。
PubMed MCP服務器是一個基於Model Context Protocol的接口服務,為AI代理和研究工具提供PubMed生物醫學文獻數據庫的全面訪問能力。支持文獻搜索、元數據獲取、引用分析、研究計劃生成和數據可視化等功能,通過NCBI E-utilities API實現高效集成。
一個為Dart/Flutter官方包倉庫pub.dev設計的MCP服務器,提供包搜索、信息檢索、版本管理、文檔訪問等功能,支持AI助手高效獲取包數據。
概述:MCP 服務器充當中間件,使 AI 代理能夠通過連接到本地數據和遠程服務來實現任務自動化。它支持如查詢執行和提示等功能,以高效處理上下文。這代表了向完全自動化的 AI 系統邁出的一步,這些系統能夠執行復雜操作。
Fetcher MCP是一個基於Playwright無頭瀏覽器的網頁內容抓取服務器,利用AI技術高效獲取網頁信息。
MCP記憶服務器為AI助手提供長期記憶功能,基於PostgreSQL和pgvector實現高效的向量相似性搜索。
基於mcp-server的項目,支持AI大模型高效調用spinq的量子計算硬件資源,提供Windows和macOS的一鍵安裝腳本,自動檢測Python環境並安裝依賴。
AgentREPL.jl 是一個通過 MCP 協議為 AI 代理提供持久化 Julia REPL 會話的工具,解決了 Julia 啟動和編譯延遲問題,使 AI 代理能高效執行代碼。
一個集成Perplexity AI的智能研究助手,提供搜索、文檔檢索、API發現和代碼現代化檢查功能,支持上下文跟蹤和高效API管理。
一個用於可視化和分析目錄結構的強大工具,支持AI助手高效導航項目文件。