谷歌发布Gemini Embedding2多模态嵌入模型,可将文本、图像、视频、音频及PDF统一映射到同一语义空间,简化AI数据处理,提升多模态检索与理解能力。这标志着谷歌从单一文本嵌入迈向统一多模态语义建模。此前,谷歌曾推出支持百种语言的文本嵌入模型。
春节期间,美团AI管家“小团”成为年轻人返乡的“赛博智囊”,从搜索工具升级为决策大脑,重塑社交方式并引流线下实体经济。其通过海量数据处理,精准核验真实消费信息,连接线上决策与线下体验,推动消费复苏。
华尔街投资者正从AI硬件红利转向关注其带来的“生存危机”,金融界开始排查可能因AI普及而衰退的行业。目前,AI已对初级分析师、数据录入员等职业产生替代作用。分析师指出,涉及大量数据处理和基础逻辑归纳的岗位均面临风险。
东京初创公司InfiniMind获580万美元种子轮融资,由前谷歌员工创立,致力于开发AI基础设施,将海量未利用的视频音频“暗数据”转化为可搜索的结构化商业智能,应对企业数据处理挑战。
首款AI原生电子表格,AI像人类专家一样精确操作表格
AI驱动的电子表格编辑器,提升生产力,分析更快、创建更佳
Sum Buddy™是易用电子表格,有AI辅助,解决公式难题,安全保存数据。
用Kadabra AI在几分钟内构建数据、营销和运营工作流
Tencent
-
Input tokens/M
Output tokens/M
24
Context Length
Anthropic
$5.6
$28
200
AbstractPhil
MM-VAE Lyra是一个专门用于文本嵌入转换的多模态变分自编码器,采用几何融合技术。它结合了CLIP-L和T5-base模型,能够有效处理文本嵌入的编码和解码任务,为多模态数据处理提供创新解决方案。
Open-Bee
Bee-8B是一个先进的全开源多模态大语言模型,专注于数据质量,旨在缩小与专有模型的性能差距。通过使用高质量的Honey-Data-15M语料库和先进的数据处理管道HoneyPipe,在复杂推理等方面展现了卓越性能。
inference-net
Schematron-3B是由Inference.net推出的长上下文提取模型,专注于将嘈杂的HTML转换为符合自定义模式的干净、类型化的JSON。该模型针对网页抓取、数据摄取以及将任意页面转换为结构化记录进行了专门训练,为数据处理和分析提供了高效的解决方案。
Salesforce
Moirai 2.0 是一个仅含解码器的通用时间序列预测Transformer模型,在多个高质量数据集上进行了预训练,包括GIFT-Eval、Chronos数据集子集、合成时间序列和Salesforce内部运营数据。相比第一版本,在损失函数、预测方式、数据处理等方面进行了重大改进。
winninghealth
WiNGPT-Babel-2 是一款专为多语言翻译任务优化的语言模型,支持55种语言的翻译,特别优化了中文翻译和结构化数据处理能力。
RUCKBReasoning
TableLLM是一款专为处理表格数据操作任务而设计的大语言模型,适用于真实办公场景中的表格数据处理需求。
Danielbrdz
基于google/gemma-3-4b-it模型训练的多模态模型,专注于数学、编程、科学和解谜领域的高质量数据处理。
FriendliAI
Phi-3.5-vision是一款轻量级、先进的开源多模态模型,支持128K上下文长度,专注于高质量、富含推理的文本和视觉数据处理。
cortexso
Deepscaler是一款基于DeepScaleR-1.5B-Preview开发的高级AI模型,专注于提升机器学习任务的效率与可扩展性。该模型提供高质量的预测分析和数据处理能力,适用于自然语言处理、计算机视觉等复杂场景,在金融、医疗和娱乐等行业有广泛应用。
TableLLM是一款强大的大语言模型,旨在高效处理表格数据处理任务,满足真实办公场景的需求。
Isotonic
基于microsoft/mdeberta-v3-base微调的PII(个人身份信息)识别与掩码模型,支持多语言隐私数据处理
Jeska
基于GroNLP/bert-base-dutch-cased微调的荷兰语BERT模型,适用于对话数据处理任务
Cognee是一个为AI代理提供记忆功能的开源项目,通过模块化ECL管道构建动态知识图谱,支持多种数据源和格式,减少幻觉并降低成本。
一个无需安装Excel即可操作Excel文件的MCP服务,支持创建工作簿、读写数据、格式设置、图表生成等功能。
flyto-core是一个可调试的自动化引擎,提供完整的执行追踪、任意步骤重放和状态快照功能,支持412个模块涵盖浏览器自动化、数据处理、API集成等78个类别,通过CLI、MCP服务器和HTTP API等多种方式使用。
Clippy是macOS终端剪贴板工具,支持文件引用复制、GUI粘贴、最近下载管理、管道数据处理和MCP服务器AI集成,提升工作效率。
Forensics-Mcp-Server是一个与取证相关的MCP服务项目,可能涉及数据处理或通信服务。
Dumpling AI MCP服务器是一个集成了多种AI功能和数据处理能力的协议服务器实现
腾讯云COS MCP Server是一个基于MCP协议的服务,无需编码即可让大模型快速接入腾讯云存储(COS)和数据万象(CI)能力,提供文件上传下载、图片处理、视频截帧等云端存储与处理功能。
InsightFlow是一个结合实时数据处理与AI智能分析的先进分析平台,通过Model Context Protocol(MCP)实现高级AI能力,并与Claude AI无缝集成,提供智能数据分析和决策支持。
一个基于MCP协议的Pandas数据处理服务器,提供CSV文件读取、Pandas代码执行和交互式图表生成功能。
Mapbox开发者MCP服务器,为AI助手提供直接访问Mapbox开发者API的能力,帮助开发者更高效地构建地图应用,支持样式管理、令牌管理、文档查询、地理数据处理等功能。
一个完全在本地运行的隐私优先文档搜索服务器,通过MCP协议为AI编程工具提供语义搜索功能,无需API密钥或云端服务,所有数据处理均在用户计算机上完成。
一个无需安装Excel即可操作Excel文件的MCP服务器
ScrapeGraph MCP Server是一个生产就绪的模型上下文协议服务器,提供与ScrapeGraph AI API的无缝集成,使语言模型能够利用先进的AI驱动网页抓取功能。
该项目是一个与CyberChef Server API对接的MCP服务器,允许用户通过任意LLM/MCP客户端调用CyberChef中的工具和资源,包括获取操作分类、执行食谱操作以及自动解码等功能。
一个基于Python的Solana区块链模型上下文协议服务器,提供实时数据处理、模型交互接口及RESTful API,支持Docker部署。
一个强大的JSON数据处理工具,提供模式生成、智能过滤和远程数据支持,专为LLM上下文优化设计。
一个基于TypeScript的MCP服务器,用于通过LLM或API集成操作CSV/XLSX电子表格文件,支持查看、筛选、排序和更新功能。
一组实现MCP协议的Python工具服务器,为AI助手提供YouTube数据处理、Word文档处理、图表渲染等功能扩展。
Dumpling AI MCP服务器是一个集成了多种AI功能的模型上下文协议服务器,提供数据抓取、内容处理、知识管理、AI代理和代码执行等能力。
TSAP MCP服务器是一个基于模型上下文协议(MCP)的文本搜索与分析处理系统,为代码智能和文本分析提供标准化接口服务。项目包含核心TSAP功能、工具API和MCP适配层三大组件,支持文本搜索、代码分析、数据处理等多种功能,并能与Claude Desktop等MCP客户端无缝集成。