新研究警告:大語言模型持續接觸無意義網絡內容可能導致性能顯著下降,推理能力和自信心受損。多所美國大學團隊提出“LLM腦衰退假說”,類比人類過度接觸無腦內容造成的認知損害。
蘋果公司正加緊招聘推理模型領域專家,以解決其研究揭示的大型語言模型重大缺陷。招聘聚焦開發更準確高效的新型架構,重點強化推理、規劃、工具使用和基於代理的LLM能力。
DeepSeek發佈創新OCR模型DeepSeek-OCR,引入"視覺記憶壓縮"機制,模仿人類視覺記憶方式,將長文本信息壓縮到圖像中處理。這一突破性技術旨在解決大型語言模型處理超長上下文時計算資源激增的難題,在圖像文檔解析方面達到頂級性能,讓AI實現高效"看圖閱讀"。
Exa Labs推出Exa Code,專爲優化Coding Agent設計。該工具索引超10億文檔、GitHub倉庫和StackOverflow內容,提供精準代碼上下文,顯著提升LLM代碼生成準確性。在代碼幻覺評估中表現卓越,超越所有現有網絡搜索工具。目前免費開源,引發開發者廣泛關注。其核心創新在於突破傳統搜索框架,專注於代碼場景的高效支持。
企業級 LLM 平臺,提供統一 API 和智能路由。
使用Scorecard簡單構建和測試LLM應用,提供可預測且不斷改進的AI體驗。
提供高質量 AI 接口服務,支持多種 AI 模型,安全穩定。
以數據 + 大模型驅動的智能合同平臺,提升合同工作效率。
nvidia
-
輸入tokens/百萬
輸出tokens/百萬
128k
上下文長度
deepseek
$3.96
$15.77
4.1k
RESMP-DEV
這是使用LLM Compressor和NVFP4格式對Qwen/Qwen3-Next-80B-A3B-Thinking進行量化後的版本,採用FP4微縮放技術,在保持高精度的同時大幅減少模型存儲和計算需求。
llm-semantic-router
這是一個基於bert-base-uncased微調的LoRA模型,專門用於檢測文本中的個人身份信息(PII)。該模型採用低秩適應技術優化,是semantic-router項目的一部分,支持Python和Rust環境使用。
基於bert-base-uncased通過LoRA(低秩自適應)技術微調的意圖分類模型,可將文本分類為商業、技術、科學等類別,是語義路由器項目的一部分,針對Rust中的Candle框架進行了優化。
基於BERT基礎無大小寫模型,使用LoRA(低秩自適應)技術進行微調的意圖分類模型,可將文本分類為商業、技術、科學等類別,是語義路由器項目的一部分,針對Rust語言中的Candle框架進行了優化。
DevQuasar
這是Qwen/Qwen3-Next-80B-A3B-Instruct的量化版本,基於llmcompressor工具實現,致力於讓知識為每個人所用,推動知識的廣泛傳播。
這是LLM360/K2-Think模型的量化版本,致力於讓知識更加自由地傳播,秉持'讓知識為每個人所用'的理念。該版本通過量化技術優化了模型大小和推理效率。
llmat
Apertus-8B-Instruct-2509-NVFP4是基於swiss-ai/Apertus-8B-Instruct-2509的NVFP4量化版本,通過llmcompressor工具生成。該模型在保持性能的同時顯著減少了存儲空間和計算資源需求,提升了推理效率。
parthmodi152
這是一個基於Qwen2.5-7B-Instruct模型使用Unsloth技術進行微調的優化版本,實現了2倍的訓練加速,專注於文本生成任務。
sugoitoolkit
Sugoi LLM 32B Ultra是基於Qwen2.5-32B-Instruct優化的高性能大語言模型,充分釋放了前作Sugoi 32B模型的全部潛力。該模型採用GGUF格式,專注於翻譯任務,具有出色的多語言處理能力。
TildeAI
TildeOpen LLM 是一個開源的基礎語言模型,專門為服務代表性不足的北歐和東歐語言而設計。該模型由歐盟委員會資助,在LUMI超級計算機上訓練,擁有300億參數,解決了19種重點語言使用者在現有AI系統中面臨的性能差距問題。
ramblingpolymath
Qwen3-30B-A3B-Thinking-2507的W4A16量化版本,使用LLM-Compressor進行4位權重和16位激活量化。相比FP16版本,內存佔用減少約75%,在支持的硬件上實現更快的推理速度。該模型具有出色的推理能力、工具調用能力和長上下文支持。
這是基於LLM-Compressor對Qwen3-30B-A3B-Instruct-2507進行W8A8(8位權重和激活值)量化的版本。相比FP16版本,內存佔用減少約50%,在支持的硬件上實現更快的推理速度,特別適合Ampere及更舊的GPU架構。
skt
A.X 3.1 Light 是一款專為韓語理解和企業部署優化的輕量級大語言模型(LLM),由SKT完全自主研發。
Mungert
xLAM-2-3b-fc-r GGUF模型是基於特定量化方法生成的文本生成模型,專注於函數調用、LLM代理和工具使用場景。
iapp
Chinda LLM 4B是iApp Technology推出的前沿泰語模型,基於Qwen3-4B架構構建,為泰國AI生態系統帶來先進的思考能力。
llm-jp
由日本國立情報學研究所開發的大語言模型,基於LLM-jp-3構建,通過指令預訓練技術顯著提升了遵循指令的能力。
LLM-jp-3.1-1.8b是由日本國立情報學研究所開發的大語言模型,基於LLM-jp-3系列,融入指令預訓練增強指令遵循能力。
LLM-jp-3.1-13b-instruct4是由日本國立情報學研究所開發的大語言模型,通過指令預訓練顯著提升了指令遵循能力,支持日語和英語等多種語言。
unsloth
Devstral是一款專為軟件工程任務設計的智能LLM,由Mistral AI和All Hands AI合作開發,擅長代碼探索、多文件編輯和驅動軟件工程代理。
Spark-TTS是一款基於大型語言模型(LLM)的高效文本轉語音系統,支持中英文雙語合成和零樣本語音克隆。
MCP Go 是一個 Go 語言實現的模型上下文協議(MCP)服務端框架,用於連接 LLM 應用與外部數據源和工具。它提供了資源管理、工具調用、提示模板等核心功能,支持會話管理和中間件擴展。
一個基於Playwright的MCP服務器,為LLM提供瀏覽器自動化能力
Serena是一個強大的開源編碼代理工具包,能夠將LLM轉化為可直接在代碼庫上工作的全功能代理。它提供類似IDE的語義代碼檢索和編輯工具,支持多種編程語言,並可通過MCP協議或Agno框架與多種LLM集成。
WhatsApp MCP服務器是一個通過WhatsApp網頁多設備API連接個人賬戶的工具,支持消息搜索、發送及多媒體處理,並與Claude等LLM集成。
Notion MCP Server是一個連接Notion API與LLM的中間件服務,通過Markdown轉換優化交互效率。
Supermemory是一個AI驅動的記憶引擎,旨在通過整合個人數據為LLM提供上下文知識,實現信息的智能管理和檢索。
Playwright MCP是一個基於Playwright的瀏覽器自動化服務器,通過結構化數據而非像素輸入實現LLM與網頁的交互。
Eino是一個專為Golang設計的LLM應用開發框架,旨在通過簡潔、可擴展、可靠且高效的組件抽象和編排能力,簡化AI應用開發流程。它提供豐富的組件庫、強大的圖形編排功能、完整的流處理支持以及高度可擴展的切面機制,覆蓋從開發到部署的全週期工具鏈。
Opik是一個開源的LLM評估框架,支持追蹤、評估和監控LLM應用,幫助開發者構建更高效、更經濟的LLM系統。
Supabase MCP Server是一個連接Supabase項目與AI助手的工具,通過Model Context Protocol(MCP)標準化大型語言模型(LLMs)與外部服務的交互,實現數據庫管理、配置獲取和數據查詢等功能。
mcpo是一個簡單易用的代理工具,可將任何MCP工具快速轉換為兼容OpenAPI的HTTP服務器,使其能夠通過標準RESTful接口訪問,方便與LLM代理和應用集成。
Context7 MCP是一個為AI編程助手提供即時、版本特定文檔和代碼示例的服務,通過Model Context Protocol直接集成到提示中,解決LLM使用過時信息的問題。
Notte是一個開源的全棧網絡AI代理框架,提供瀏覽器會話、自動化LLM驅動的代理、網頁觀察與操作、憑證管理等功能,旨在將互聯網轉化為代理友好的環境,並通過自然語言描述網站結構,降低LLM的認知負擔。
mcp-get是一個命令行工具,用於發現、安裝和管理MCP服務器,簡化LLM與外部數據源的連接。
這是一個關於Web3 Model Context Protocol (MCP) 服務器的精選列表,涵蓋了鏈交互、交易、DeFi、市場數據、工具和社交等多個類別。MCP是一個開放協議,標準化了應用程序如何向LLM提供上下文,類似於AI應用程序的USB-C端口。DeMCP是第一個去中心化的MCP網絡,專注於為代理提供自研和開源的MCP服務,支持加密支付,並結合TEE和區塊鏈註冊表重新定義了MCP的安全性和可靠性。
MCP LLMS-TXT文檔服務器是一個開源工具,允許開發者通過MCP協議控制IDE和應用程序訪問llms.txt文檔資源。
DuckDuckGo搜索MCP服務器,為Claude等LLM提供網頁搜索和內容抓取服務
MCP MongoDB服務器是一個模型上下文協議服務,允許LLM與MongoDB數據庫交互,提供集合模式檢查、查詢執行和智能ID處理等功能,支持只讀模式和安全配置。
Claude Debugs For You是一個VS Code擴展,通過MCP服務器實現與LLM(如Claude)的交互式代碼調試。
Video Editor MCP是一個視頻編輯服務器,提供視頻上傳、搜索、生成和編輯功能,支持通過LLM和Video Jungle平臺進行操作。