Mistral AI發佈新一代文檔識別技術Mistral OCR3,在表格、掃描文檔、複雜表格及手寫識別方面表現突出,整體性能較上一代提升74%。該技術旨在高效準確提取各類文檔中的文本和嵌入式圖像,支持多格式處理,顯著提升文檔處理效率與精度。
谷歌向開發者開放新版深度研究代理,可嵌入應用。該代理採用迭代研究方法,能自主搜索、分析並持續優化答案,性能優於前代模型。
谷歌搶先推出Gemini Deep Research,基於Gemini 3 Pro大模型,能生成高質量報告,並通過Interactions API向開發者開放,允許將高級研究能力嵌入第三方應用,加速佈局“代理式AI”時代。
谷歌FACTS團隊與Kaggle聯合發佈FACTS基準測試套件,旨在評估生成式AI模型在企業任務中的事實性和真實性。該框架彌補了現有基準只關注問題解決能力、忽略輸出信息與真實世界數據一致性的缺陷,尤其針對圖像或圖表中的信息嵌入,對法律、金融等關鍵領域尤爲重要。
為創始人提供嵌入式AI戰略支持,重塑類似Palantir的智能服務。
為產品和工程團隊提供嵌入式分析解決方案,包括交互式儀表板、自助報告、Explo AI和企業級安全性。
在新標籤頁中嵌入網站,控制Hue燈光,創建備忘錄,查看天氣,控制Spotify等功能。
Gemini Embedding 是一種先進的文本嵌入模型,通過 Gemini API 提供強大的語言理解能力。
Alibaba
$2
輸入tokens/百萬
-
輸出tokens/百萬
上下文長度
Tencent
$0.7
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先進的ColPali風格多模態嵌入模型,能夠將文本查詢、視覺文檔(如圖像、PDF)或短視頻映射為對齊的多向量嵌入。該模型結合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的優勢,在ViDoRe基準測試中表現出色,同時顯著減少了嵌入佔用空間。
nightmedia
這是一個實驗性的量化大語言模型,採用Deckard(qx)量化方法,嵌入層為3位量化。該模型通過範數保持雙投影消除(NPBA)技術重構,不僅移除了安全限制機制,還增強了模型的認知深度和推理能力。
magiccodingman
這是一個實驗性的混合量化模型,採用MXFP4_MOE混合權重技術,在保持接近Q8精度的同時,實現了更小的文件大小和更高的推理速度。模型探索了MXFP4與高精度嵌入/輸出權重的組合,在密集模型上取得了精度近乎無損的優化效果。
這是一個基於Qwen3 4B模型的混合量化版本,採用MXFP4_MOE混合權重技術,在保持近乎無損精度的同時實現了更小的文件大小和更高的推理速度。該模型通過精心組合MXFP4和高精度嵌入/輸出權重,達到了接近Q8量化的精度水平,同時具備Q4-Q6級別的吞吐量。
sd2-community
Stable Diffusion v2-1-unclip是基於Stable Diffusion 2.1微調的擴散模型,能夠接受文本提示和CLIP圖像嵌入,用於創建圖像變體或與文本到圖像的CLIP先驗結合使用。
Tarka-AIR
Tarka-Embedding-350M-V1是一個擁有3.5億參數的文本嵌入模型,能夠生成1024維的密集文本表示。該模型針對語義相似性、搜索和檢索增強生成(RAG)等下游應用進行了優化,支持多種語言並具有長上下文處理能力。
ekacare
Parrotlet-e是一款先進的多語言醫學嵌入模型,專門針對印度各語言中的醫學術語進行優化。它基於BAAI/bge-m3進行微調,在超過1800萬對多語言醫學術語對上進行訓練,支持12種印度語言和英語,對臨床文檔中的縮寫、拼寫變體和口語表達具有很強的魯棒性。
AbstractPhil
MM-VAE Lyra是一個專門用於文本嵌入轉換的多模態變分自編碼器,採用幾何融合技術。它結合了CLIP-L和T5-base模型,能夠有效處理文本嵌入的編碼和解碼任務,為多模態數據處理提供創新解決方案。
mradermacher
UME-R1-7B的靜態量化版本,支持句子相似度、嵌入、零樣本圖像分類、視頻文本到文本等多任務。提供多種量化類型以滿足不同需求,從輕量級Q2_K到高質量Q8_0版本。
samwell
NV-Reason-CXR-3B GGUF是NVIDIA NV-Reason-CXR-3B視覺語言模型的量化版本,專為邊緣設備部署優化。這是一個30億參數的模型,專注於胸部X光分析,已轉換為GGUF格式並進行量化處理,可在移動設備、桌面設備和嵌入式系統上高效運行。
labhamlet
WavJEPA是基於波形的聯合嵌入預測架構的音頻基礎模型,利用高級語義表示學習解決語音單元或標記級表示學習的不足。在眾多下游基準任務中顯著優於最先進的時域音頻基礎模型,同時所需計算資源大幅減少。
Tarka-Embedding-150M-V1是一個具有1.5億參數的嵌入模型,可生成768維的密集文本表示。它針對語義相似性、搜索和檢索增強生成(RAG)等多種下游應用進行了優化,專注於捕捉深層上下文語義,以支持跨不同領域的通用文本理解。
hetbhagatji09
這是一個基於MiniLM架構的輕量級句子嵌入模型,專門用於生成高質量的句子向量表示。模型採用MultipleNegativesRankingLoss進行訓練,在句子相似度計算和特徵提取任務上表現出色。
s3dev-ai
這是Google embeddinggemma-300m基礎模型的各種GGUF格式量化版本,專門為高效部署和不同場景使用而優化。該模型專注於句子嵌入和相似度計算任務。
這是一個基於Qwen3-Coder-REAP-25B-A3B的量化版本,專門為Mac設備優化。採用Deckard(qx)公式進行量化,嵌入層、頭部和選擇性注意力路徑使用6位量化,其餘部分使用5位量化,以32為分組大小,在保持接近q8量化質量的同時實現更高效的運行。
nvidia
Llama Nemotron Embedding 1B模型是NVIDIA開發的專為多語言和跨語言文本問答檢索優化的嵌入模型,支持26種語言,能夠處理長達8192個標記的文檔,並可通過動態嵌入大小大幅減少數據存儲佔用。
KaLM-Embedding
KaLM-Embedding-V2.5是一款通用且輕量級的嵌入模型,通過卓越的訓練技術和數據,在同類規模模型中達到最優性能,甚至能與規模大3-26倍的模型相媲美。支持多語言和多種嵌入維度選擇。
pierre-tassel
Rapido NER 是一個強大的多語言命名實體識別器和實體嵌入模型,以貓 Rapido 命名。該模型提供強大的多語言 NER 性能,支持實體聚類和檢索,處理文檔內聚類以及長上下文等任務。
Rapido NER是一個強大的多語言命名實體識別和實體嵌入模型,支持55種語言,集成了編碼器、基於注意力的提及池化、類型投影層和條件隨機場解碼,專門用於解決命名實體識別領域的常見問題。
codefuse-ai
F2LLM是一個基於Qwen3-0.6B微調的開源文本嵌入模型,通過在600萬高質量查詢-文檔對上進行單階段訓練,實現了與當前最優模型相匹配的嵌入性能。該模型專門用於特徵提取任務,支持英文文本處理。
Claude Context是一個MCP插件,通過語義代碼搜索為AI編程助手提供整個代碼庫的深度上下文,支持多種嵌入模型和向量數據庫,實現高效代碼檢索。
OpenZeppelin Contracts Wizard是一個交互式智能合約構建工具,允許用戶通過選擇合約類型、參數和功能來生成基於OpenZeppelin組件的合約代碼。支持多種編程語言,並提供API和嵌入功能。
Wren Engine是一個為MCP客戶端和AI代理設計的語義引擎,提供語義層支持,使AI能準確理解企業數據模型和業務邏輯。它支持多種數據源,嵌入MCP客戶端,確保數據交互的精確性和治理。
一個MCP服務器,通過向量嵌入和語義相似性為任何AI模型提供智能搜索Claude Agent Skills的能力,實現漸進式技能發現和跨平臺技能共享
MCP應用是一個結合RAG和網絡搜索工具的服務,使用OpenAI嵌入向量存儲,PostgreSQL作為數據庫,PGVector作為向量存儲,支持知識檢索和文檔添加功能。
一個基於Qdrant向量數據庫和OpenAI嵌入的語義搜索服務
一個基於MCP協議的語義代碼搜索服務器,支持OpenAI和Ollama兩種嵌入模型,能夠索引本地項目或Git倉庫,提供企業級的私有化代碼搜索解決方案。
該項目是一個基於Model Context Protocol (MCP)標準的文檔處理服務器,通過構建向量數據庫和MCP接口,使AI助手能夠訪問外部文檔資源,突破大語言模型的知識限制。項目包含文檔處理流水線和MCP服務端兩大組件,支持多種嵌入模型和文件格式,可應用於最新技術文檔查詢、私有代碼庫理解等場景。
一個基於Python的文檔處理與檢索增強生成(RAG)服務器,使用DuckDB數據庫存儲嵌入向量,支持多種文件格式處理並提供Web界面和API接口。
Insights Knowledge Base (IKB) MCP Server 是一個即插即用的免費知識庫,內置10,000+高質量洞察報告,支持本地安全存儲和私有文檔解析。項目優化了數據處理效率,提供每週報告更新,並計劃未來集成嵌入模型和增強報告系統。
為Claude Code提供持久語義記憶能力的MCP服務器,支持跨會話信息存儲和語義檢索,使用本地嵌入和PostgreSQL數據庫。
MCPunk是一個無需嵌入的代碼庫對話工具,通過智能搜索代碼塊幫助LLM理解代碼庫。
這是一個基於Cloudflare Workers和Remix 3的MCP協議演示項目,展示瞭如何在AI聊天界面中嵌入交互式計算器小組件。項目包含完整的MCP服務器實現、狀態管理和小部件通信系統,特別設計了TRON風格的隱藏彩蛋。
一個專業的串口通信MCP服務器,為AI助手提供全面的串口通信能力,支持嵌入式系統、物聯網設備和硬件調試,具有跨平臺支持和多種數據格式處理功能。
基於genanki和MCP協議的自動化Anki卡片組生成服務,支持媒體文件安全嵌入和臨時下載鏈接
一個用於蘋果筆記語義搜索的MCP服務,支持本地嵌入模型、全文搜索和向量存儲。
MCP聊天分析服務器是一個基於模型上下文協議(MCP)的服務,提供聊天對話的語義分析功能,包括向量嵌入搜索、知識圖譜構建和會話模式分析。
一個提供文件語義搜索功能的MCP服務器,通過向量嵌入實現文檔內容的智能檢索
openwrt-mcp-server是一個輕量級可擴展的MCP協議服務器,專為OpenWrt嵌入式設備設計,支持MQTT和HTTP雙協議,實現設備與AI系統的雙向JSON-RPC通信,具備安全認證和模塊化架構。
WindTools MCP服務器是一個基於ChromaDB和句子轉換器的代碼助手服務,提供文檔嵌入和檢索功能,支持代碼庫索引和語義搜索。