Mistral AI发布新一代文档识别技术Mistral OCR3,在表格、扫描文档、复杂表格及手写识别方面表现突出,整体性能较上一代提升74%。该技术旨在高效准确提取各类文档中的文本和嵌入式图像,支持多格式处理,显著提升文档处理效率与精度。
谷歌向开发者开放新版深度研究代理,可嵌入应用。该代理采用迭代研究方法,能自主搜索、分析并持续优化答案,性能优于前代模型。
谷歌抢先推出Gemini Deep Research,基于Gemini 3 Pro大模型,能生成高质量报告,并通过Interactions API向开发者开放,允许将高级研究能力嵌入第三方应用,加速布局“代理式AI”时代。
谷歌FACTS团队与Kaggle联合发布FACTS基准测试套件,旨在评估生成式AI模型在企业任务中的事实性和真实性。该框架弥补了现有基准只关注问题解决能力、忽略输出信息与真实世界数据一致性的缺陷,尤其针对图像或图表中的信息嵌入,对法律、金融等关键领域尤为重要。
为创始人提供嵌入式AI战略支持,重塑类似Palantir的智能服务。
为产品和工程团队提供嵌入式分析解决方案,包括交互式仪表板、自助报告、Explo AI和企业级安全性。
在新标签页中嵌入网站,控制Hue灯光,创建备忘录,查看天气,控制Spotify等功能。
Gemini Embedding 是一种先进的文本嵌入模型,通过 Gemini API 提供强大的语言理解能力。
Alibaba
$2
Input tokens/M
-
Output tokens/M
Context Length
Tencent
$0.7
TomoroAI
TomoroAI/tomoro-colqwen3-embed-4b是一款先进的ColPali风格多模态嵌入模型,能够将文本查询、视觉文档(如图像、PDF)或短视频映射为对齐的多向量嵌入。该模型结合了Qwen3-VL-4B-Instruct和Qwen3-Embedding-4B的优势,在ViDoRe基准测试中表现出色,同时显著减少了嵌入占用空间。
nightmedia
这是一个实验性的量化大语言模型,采用Deckard(qx)量化方法,嵌入层为3位量化。该模型通过范数保持双投影消除(NPBA)技术重构,不仅移除了安全限制机制,还增强了模型的认知深度和推理能力。
magiccodingman
这是一个实验性的混合量化模型,采用MXFP4_MOE混合权重技术,在保持接近Q8精度的同时,实现了更小的文件大小和更高的推理速度。模型探索了MXFP4与高精度嵌入/输出权重的组合,在密集模型上取得了精度近乎无损的优化效果。
这是一个基于Qwen3 4B模型的混合量化版本,采用MXFP4_MOE混合权重技术,在保持近乎无损精度的同时实现了更小的文件大小和更高的推理速度。该模型通过精心组合MXFP4和高精度嵌入/输出权重,达到了接近Q8量化的精度水平,同时具备Q4-Q6级别的吞吐量。
Synthyra
Profluent - E1 是对 Profluent Bio 公司 E1 模型的忠实实现,由 Synthyra 发布。它是一个专注于蛋白质序列处理的预训练语言模型,集成了 Hugging Face AutoModel 兼容性,并提供高效的嵌入功能,旨在简化生物信息学任务中的蛋白质序列分析和表示学习。
Profluent-E1 是对 Profluent 官方 E1 模型的忠实实现,集成了 Hugging Face AutoModel 兼容性,专注于蛋白质序列的表示学习。它能够生成高质量的蛋白质序列嵌入,支持掩码语言建模、序列分类和标记分类等任务,并提供了便捷的嵌入提取和微调功能。
sd2-community
Stable Diffusion v2-1-unclip是基于Stable Diffusion 2.1微调的扩散模型,能够接受文本提示和CLIP图像嵌入,用于创建图像变体或与文本到图像的CLIP先验结合使用。
Tarka-AIR
Tarka-Embedding-350M-V1是一个拥有3.5亿参数的文本嵌入模型,能够生成1024维的密集文本表示。该模型针对语义相似性、搜索和检索增强生成(RAG)等下游应用进行了优化,支持多种语言并具有长上下文处理能力。
ekacare
Parrotlet-e是一款先进的多语言医学嵌入模型,专门针对印度各语言中的医学术语进行优化。它基于BAAI/bge-m3进行微调,在超过1800万对多语言医学术语对上进行训练,支持12种印度语言和英语,对临床文档中的缩写、拼写变体和口语表达具有很强的鲁棒性。
AbstractPhil
MM-VAE Lyra是一个专门用于文本嵌入转换的多模态变分自编码器,采用几何融合技术。它结合了CLIP-L和T5-base模型,能够有效处理文本嵌入的编码和解码任务,为多模态数据处理提供创新解决方案。
mradermacher
UME-R1-7B的静态量化版本,支持句子相似度、嵌入、零样本图像分类、视频文本到文本等多任务。提供多种量化类型以满足不同需求,从轻量级Q2_K到高质量Q8_0版本。
samwell
NV-Reason-CXR-3B GGUF是NVIDIA NV-Reason-CXR-3B视觉语言模型的量化版本,专为边缘设备部署优化。这是一个30亿参数的模型,专注于胸部X光分析,已转换为GGUF格式并进行量化处理,可在移动设备、桌面设备和嵌入式系统上高效运行。
labhamlet
WavJEPA是基于波形的联合嵌入预测架构的音频基础模型,利用高级语义表示学习解决语音单元或标记级表示学习的不足。在众多下游基准任务中显著优于最先进的时域音频基础模型,同时所需计算资源大幅减少。
Tarka-Embedding-150M-V1是一个具有1.5亿参数的嵌入模型,可生成768维的密集文本表示。它针对语义相似性、搜索和检索增强生成(RAG)等多种下游应用进行了优化,专注于捕捉深层上下文语义,以支持跨不同领域的通用文本理解。
hetbhagatji09
这是一个基于MiniLM架构的轻量级句子嵌入模型,专门用于生成高质量的句子向量表示。模型采用MultipleNegativesRankingLoss进行训练,在句子相似度计算和特征提取任务上表现出色。
s3dev-ai
这是Google embeddinggemma-300m基础模型的各种GGUF格式量化版本,专门为高效部署和不同场景使用而优化。该模型专注于句子嵌入和相似度计算任务。
这是一个基于Qwen3-Coder-REAP-25B-A3B的量化版本,专门为Mac设备优化。采用Deckard(qx)公式进行量化,嵌入层、头部和选择性注意力路径使用6位量化,其余部分使用5位量化,以32为分组大小,在保持接近q8量化质量的同时实现更高效的运行。
nvidia
Llama Nemotron Embedding 1B模型是NVIDIA开发的专为多语言和跨语言文本问答检索优化的嵌入模型,支持26种语言,能够处理长达8192个标记的文档,并可通过动态嵌入大小大幅减少数据存储占用。
redis
这是一个由Redis发布的、针对语义缓存任务优化的双编码器句子嵌入模型。它基于sentence-transformers/all-MiniLM-L6-v2微调,可将文本映射到384维向量空间,专门用于提升LangCache语义缓存系统的查询匹配精度。
KaLM-Embedding
KaLM-Embedding-V2.5是一款通用且轻量级的嵌入模型,通过卓越的训练技术和数据,在同类规模模型中达到最优性能,甚至能与规模大3-26倍的模型相媲美。支持多语言和多种嵌入维度选择。
Claude Context是一个MCP插件,通过语义代码搜索为AI编程助手提供整个代码库的深度上下文,支持多种嵌入模型和向量数据库,实现高效代码检索。
Wren Engine是一个为MCP客户端和AI代理设计的语义引擎,提供语义层支持,使AI能准确理解企业数据模型和业务逻辑。它支持多种数据源,嵌入MCP客户端,确保数据交互的精确性和治理。
OpenZeppelin Contracts Wizard是一个交互式智能合约构建工具,允许用户通过选择合约类型、参数和功能来生成基于OpenZeppelin组件的合约代码。支持多种编程语言,并提供API和嵌入功能。
一个MCP服务器,通过向量嵌入和语义相似性为任何AI模型提供智能搜索Claude Agent Skills的能力,实现渐进式技能发现和跨平台技能共享
一个提供文件语义搜索功能的MCP服务器,通过向量嵌入实现文档内容的智能检索
一个基于MCP协议的嵌入向量搜索服务器,用于查询Turso数据库中的转录片段和嵌入向量,支持通过问题搜索相关片段。
一个专业的串口通信MCP服务器,为AI助手提供全面的串口通信能力,支持嵌入式系统、物联网设备和硬件调试,具有跨平台支持和多种数据格式处理功能。
WindTools MCP服务器是一个基于ChromaDB和句子转换器的代码助手服务,提供文档嵌入和检索功能,支持代码库索引和语义搜索。
一个基于MCP协议的语义代码搜索服务器,支持OpenAI和Ollama两种嵌入模型,能够索引本地项目或Git仓库,提供企业级的私有化代码搜索解决方案。
一个基于MongoDB Atlas向量搜索和Voyage AI嵌入技术的文档检索系统,支持语义搜索和文本匹配,包含文档分块、嵌入生成和存储功能。
该项目是一个基于Model Context Protocol (MCP)标准的文档处理服务器,通过构建向量数据库和MCP接口,使AI助手能够访问外部文档资源,突破大语言模型的知识限制。项目包含文档处理流水线和MCP服务端两大组件,支持多种嵌入模型和文件格式,可应用于最新技术文档查询、私有代码库理解等场景。
一个MCP服务器项目,提供基于token数量自动选择OpenAI O3或Google Gemini 2.5 Pro模型的服务,支持文件路径递归嵌入提示词,适用于代码审查和复杂问题解决。
一个基于MCP协议的代码库语义搜索服务器,利用Gemini嵌入和Qdrant向量存储,为AI编辑器提供代码理解和搜索功能。
openwrt-mcp-server是一个轻量级可扩展的MCP协议服务器,专为OpenWrt嵌入式设备设计,支持MQTT和HTTP双协议,实现设备与AI系统的双向JSON-RPC通信,具备安全认证和模块化架构。
一个提供电子邮件处理功能的MCP服务器,集成MongoDB语义搜索和SQLite高效存储,支持Outlook邮件处理、向量嵌入生成和多邮箱管理。
一个基于本地Git仓库的代码上下文服务,提供代码语义搜索和嵌入生成功能
MCP应用是一个结合RAG和网络搜索工具的服务,使用OpenAI嵌入向量存储,PostgreSQL作为数据库,PGVector作为向量存储,支持知识检索和文档添加功能。
一个高性能的MCP服务器,用于语义代码搜索,采用Rust编写,支持混合搜索(BM25+向量嵌入)、AST智能分块和60多种编程语言。
一个MCP协议服务器,用于从TypeScript/JavaScript源代码中提取嵌入式数据(如i18n翻译或键值配置)和SVG组件,生成结构化JSON配置文件和独立SVG文件。
基于genanki和MCP协议的自动化Anki卡片组生成服务,支持媒体文件安全嵌入和临时下载链接