Salesforce对Slack进行大规模AI升级,推出30项生成式AI功能,将AI从聊天助手转变为深度嵌入工作流的“数字成员”,重塑企业协作模式。通过集成Data Cloud,新版Slack可实时调取CRM数据,员工无需离开聊天窗口即可获取信息。
阿里云推出DataAgent虚拟AI数据分析师,基于Spring AI Alibaba生态构建,旨在解决业务人员与核心数据间的“SQL鸿沟”。该系统将确定性工程流程与大模型推理能力结合,实现数据查询的自动化与智能化,提升复杂统计分析和根因定位效率。
AI初创公司Fundamental结束隐身,宣布完成2.55亿美元A轮融资,投后估值达12亿美元。本轮由Oak HC/FT等多家机构领投,Perplexity和Datadog的CEO等也以个人身份参与。公司核心产品为基础模型Nexus,旨在与ChatGPT等主流大语言模型竞争。
微软收购AI数据平台Osmos,强化数据处理能力,应对AI竞赛转向数据的关键阶段。此举整合AI工具链,构建端到端数据闭环,加剧与Snowflake等厂商的竞争。Osmos专注用AI解决“脏数据”问题。
AI数据科学平台,可通过自然语言生成Jupyter笔记本和数据可视化。
提供多种预训练模型,支持多维度筛选,助力AI模型应用与开发。
Chat4Data是一款AI网页抓取插件,通过自然语言提取网页数据。
强大的模型上下文协议 (MCP) 服务器,提供实时网页数据访问解决方案。
datalab-to
Chandra是一款先进的OCR模型,能够从图像和PDF中高精度提取文本并保留布局信息。它支持Markdown、HTML和JSON格式输出,在手写体识别、表单重构、表格处理等方面表现出色,支持40多种语言。
DatarusAI
Datarus-R1-14B-Preview是一款基于140亿参数的开源语言模型,在Qwen2.5-14B-Instruct基础上微调而成。该模型专门设计为虚拟数据分析师和研究生水平问题解决者,能够从完整的分析轨迹中学习,包括推理步骤、代码执行、错误跟踪和最终结论。
Heralax
datagen-sft-1是基于Mistral架构的7B参数大语言模型,在多个高质量数据集上进行监督微调得到的专用模型。该模型在自然语言处理任务上表现出色,特别是在文本生成和对话任务方面有显著提升。
Datadog
Toto是一个专为多元时间序列预测设计的基础模型,特别适用于可观测性指标的高效处理
datasocietyco
这是一个从BAAI/bge-base-en-v1.5微调而来的sentence-transformers模型,能将句子和段落映射到768维的密集向量空间。
EloiseInacio
基于MCG-NJU/videomae-base微调的视频理解模型,在未知数据集上训练,准确率为11.1%
DataPilot
专为AI虚拟主播(AI VTuber)对话优化的日语语言模型,基于Google的gemma-3-4b-it开发
一个以成为AI虚拟主播灵魂为目标的混合专家模型,结合了代码生成、指令跟随和多轮对话能力
DataWizardd
基于BERT架构微调的韩语金融新闻情感分析模型,专门针对汇率相关新闻摘要进行情感分类
DataSoul
这是一个通过mergekit工具合并的7B参数规模的语言模型,融合了多个指令微调模型的特点
timm
基于CLIP架构的视觉Transformer模型,专为图像特征提取设计,使用DataComp XL数据集训练
基于CLIP架构的视觉Transformer模型,专门用于图像特征提取,采用ViT-B/16结构并在DataComp XL数据集上训练
data-is-better-together
基于FLUX.1-schnell的DreamBooth LoRA权重,用于文本生成图像任务
dataautogpt3
基于Stable Diffusion XL改进的图像生成模型,结合ZTSNR与NovelAI V3技术进行训练优化
SanghyukChun
基于DataComp 1B数据集预训练的概率语言-图像预训练(ProLIP)ViT-B/16模型
Proteus v0.6是基于SDXL架构的AI图像生成模型,经过全面重构后专注于提升图像的真实感。这是重构后的首个版本,采用多视角融合技术训练,能够生成高质量的逼真图像。
google
DataGemma是基于Gemma 2微调的系列模型,用于整合Data Commons的公共统计数据,采用检索交错生成方法标注数据来源。
DataGemma是基于Gemma 2微调的系列模型,专门用于帮助大语言模型访问和整合Data Commons中的可靠公共统计数据。
FluxteusV1是基于FLUX.1-dev基础模型,融合了25个以上LoRA模型训练而成的文本生成图像扩散模型,具有多样化的风格表现力。
DataCanvas
基于InternVL-Chat-V1-5微调的多模态模型,在MMBench基准测试中表现优异
Sail是一个旨在统一流处理、批处理和计算密集型(AI)工作负载的项目,提供了Spark SQL和Spark DataFrame API的替代方案,支持单机和分布式环境。
MCP Toolbox for Databases是一个开源数据库MCP服务器,专注于企业级和生产质量,简化工具开发,提供连接池、认证等复杂功能。
一个提供金融市场数据的MCP服务器,支持查询股票和加密货币的财务数据与价格信息
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用,实现开放数据的便捷访问和社区化发布。
一个基于MCP协议的A股市场数据查询服务器,提供股票基础数据、历史行情、财务报表等多种查询功能
Open Data MCP是一个开源项目,旨在通过MCP协议将公开数据集快速接入LLM应用。项目提供CLI工具实现2分钟接入(当前支持Claude),并建立社区协作框架让开发者能轻松贡献和发布公开数据集。核心目标是构建连接所有LLM应用与数百万公开数据集的基础设施。
DataForSEO API的MCP服务器实现,支持多种搜索引擎数据查询
一个用于与法国Datagouv API交互的MCP服务器,提供企业信息查询功能。
一个基于Datawrapper Python库的MCP服务器,允许AI助手创建、发布、更新和展示Datawrapper图表,支持通过聊天交互完成图表操作。
一个用于访问新加坡data.gov.sg政府数据集的MCP服务器,提供数据集浏览、搜索和下载功能,内置API速率限制。
MCP-FREDAPI是一个集成联邦储备经济数据(FRED)API的项目,通过Model Context Protocol协议为AI助手提供经济时间序列数据查询功能。
一个基于Spring Boot和Spring AI的股票数据服务项目,提供股票实时交易信息、分时价格和公司详情查询功能。
EOSC数据共享MCP服务器,提供HTTP接口通过搜索API和大型语言模型帮助用户查找所需数据集和工具。
Alkemi MCP服务器是一个通过STDIO包装的HTTP MCP端点,允许用户连接Snowflake、Google BigQuery、DataBricks等数据源,通过Alkemi平台存储数据库元数据、生成查询并执行,实现团队共享数据查询能力
Bright Data提供的MCP服务,允许AI客户端访问和引用公开网络数据
FOCUS DATA MCP Server是一个将自然语言转换为SQL语句的AI助手服务,采用两步生成方案控制LLM幻觉,提升非技术用户对SQL结果的信任度。
Datadog MCP服务器是一个通过Model Context Protocol与Datadog API交互的服务端工具
一个用于访问和操作Hugging Face数据集的MCP服务器
医疗AI助手数据服务
DBMCP是一个基于MCP架构的数据库查询服务