Apache Doris 4.0 正式发布,聚焦AI驱动、搜索增强和离线提效三大方向。新增向量索引和AI函数等特性,提升数据处理效率与用户体验。通过深度集成向量索引技术,高效处理文本嵌入等高维向量数据,支持用户在同一平台使用SQL进行结构化分析。
苹果公司正开发一款类似ChatGPT的iPhone应用,用于测试Siri的重大升级。该应用由AI部门主导,旨在评估新功能,提升Siri在个人数据中的搜索效率,如快速查找歌曲和邮件。此举预示明年Siri将更智能,用户使用体验有望简化。
视觉检索增强生成(Vision-RAG)与文本检索增强生成(Text-RAG)在企业信息检索中的对比研究显示,Text-RAG需先将PDF转为文本再嵌入索引,但OCR技术常导致转换不准确,影响检索效率。Vision-RAG则直接处理视觉信息,可能更高效。研究揭示了两种方法在应对海量文档时的优缺点,为企业优化搜索策略提供参考。
OpenSearch 3.2版本正式发布,重点提升搜索和可观测性,特别优化生成式AI应用场景。该版本延续3.x系列创新,显著改进搜索性能和可扩展性,升级近似框架并支持search_after查询,有效解决性能瓶颈,优化ASC和DESC排序效率。
North 是一个安全的 AI 工作空间,结合了 LLM、搜索和自动化,提升工作效率。
整合所有资料,让 AI 搜索回答,提升知识获取效率。
AI搜索、划词翻译、网页总结,提升阅读与检索效率。
专为开发者设计的AI搜索引擎,提升搜索效率。
nvidia
-
Input tokens/M
Output tokens/M
128k
Context Length
cpatonn
Llama-3.3-Nemotron-Super-49B-v1.5是基于Meta Llama-3.3-70B-Instruct的大语言模型,经过多阶段后训练增强了推理、聊天偏好和代理任务能力。采用神经架构搜索技术,在保持高准确性的同时显著提升效率,支持128K令牌上下文长度和多语言处理。
Llama-3.1-Nemotron-Ultra-253B-CPT-v1是基于Meta Llama-3.1-405B-Instruct的大型语言模型,支持128K tokens上下文长度,经过神经架构搜索优化,在准确性和效率之间取得良好平衡。
Kwaipilot
OASIS是由Kwaipilot开发的最先进的代码嵌入模型,融合了仓库级程序分析、OASIS-instruct数据合成算法及专用融合损失函数,在代码搜索效率和准确性方面设定了新基准。
opensearch-project
OpenSearch的学习型稀疏检索模型v2迷你版,将文档编码为稀疏向量,优化搜索相关性和效率
基于蒸馏技术的稀疏检索模型,专为OpenSearch优化,支持免推理文档编码,在搜索相关性和效率上优于V1版本
DevContext是一个强大的AI开发上下文系统,为开发者提供项目中心化的持续上下文感知能力,包含短期/长期/情景/语义四种记忆类型,支持代码结构分析和向量搜索,显著提升开发效率。
一个高效的任务管理器,支持多种文件格式(Markdown、JSON、YAML),提供强大的搜索、过滤和组织功能,专为最小化工具混淆和最大化LLM预算效率而设计。
一个MCP服务器,使AI助手能够直接搜索和分析Datadog日志,通过自然语言查询提高故障排查和日志分析效率。