国地中心与纬钛机器人联合发布全球首个跨本体视触觉多模态机器人操作数据集“白虎-VTouch”,规模最大、模态最完整。该数据集首创跨本体视触觉多模态真实交互数据采集范式,包含高精度视触觉传感器数据、RGB-D深度视觉及关节位姿等关键信息,推动机器人视触觉感知从单一形态向跨本体真实交互跨越。
穹彻智能推出便携设备“口袋机采”,配合手机应用,让普通用户也能在日常生活环境中参与高质量数据采集,将专业工作场景拓展至更广阔的真实世界。
诺亦腾机器人完成Pre-A+轮融资,由启明创投领投,多家机构参投及追加,实现超额认购。公司累计融资已达数亿元,资金将用于具身智能多模态数据的采集、处理与交互技术研发。
宇树科技推出以轮式人形机器人G1-D为核心的全栈解决方案,集成数据采集、处理、标注、审核及资产管理功能,提供一站式AI模型开发支持,涵盖分布式训练、自定义模型开发与部署服务,兼容主流开源模型。
提供住宅、数据中心和移动代理,全球覆盖,适用于多场景
拥有8000万住宅代理IP,可全球无缝采集数据,支持大规模提取。
智元机器人发布的具身智能一站式开发平台,覆盖数据采集到模型推理全链路
一个基于 AI 的趋势发现和内容发布系统,支持多源数据采集、智能总结和自动发布到微信公众号。
Openai
-
输入tokens/百万
输出tokens/百万
上下文长度
Anthropic
$105
$525
200
$21
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
$8.75
$70
400
$1.75
$14
$0.35
Tencent
24
Xai
Huawei
128
Keltezaa
基于Flux模型训练的德鲁·巴里摩尔LoRA模型,数据集采集自1995-2000年间影像素材
Cnam-LMSSC
EBEN 是一款针对法语语音的带宽扩展模型,专门用于处理体传导语音传感器(如喉部麦克风)采集的音频。它能够对低频、含噪的体传导语音进行降噪,并从低频内容中再生中高频成分,从而显著提升音频的清晰度和质量。该模型基于特定的非传统传感器数据训练,适用于特定领域内的语音增强任务。
该项目实现了一个基于pyATS和Genie的MCP服务器,通过JSON-RPC 2.0协议提供结构化、模型驱动的网络设备交互能力,支持安全执行CLI命令、配置变更及数据采集,适用于容器化或LangGraph集成场景。
AnySite MCP服务器是一个基于模型上下文协议的多平台网络数据采集工具,支持LinkedIn、Instagram、Reddit、Twitter等平台,为AI代理提供实时、结构化的网络数据访问能力。
Xcatcher是一个基于远程MCP协议的高性能X(Twitter)数据爬取服务,支持通过x402协议使用USDC在Base和Solana链上进行按需付费,提供OpenAPI规范便于AI代理集成,专注于大规模用户最新帖子的快速采集。
这是一个基于MCP框架的微博热搜数据采集服务器,提供热搜榜单、热搜详情及评论获取功能。
Aranet4二氧化碳传感器的MCP服务器,支持设备扫描、数据采集存储、历史查询及可视化功能,提供AI辅助配置。
MCP-Undetected-Chromedriver是一个基于undetected-chromedriver的MCP服务,提供绕过反爬检测的浏览器自动化控制接口,适用于网页自动化测试和数据采集场景。
LinkedIn数据采集MCP服务器,通过手动输入账号密码认证,使用Selenium浏览器自动化技术抓取LinkedIn个人资料的完整信息,包括工作经历、教育背景、技能和联系方式等
该脚本用于从GitHub页面抓取MCP服务器的配置信息,主要针对LiteLLM使用。通过解析JSON配置或下拉菜单中的Docker、npx等配置实现数据采集。
一个基于AI的网络爬虫项目,提供MCP服务
一个基于MCP协议的宝可梦数据服务项目,包含数据服务器和采集服务,提供宝可梦信息查询、搜索、比较等功能。
Crawl4AI MCP服务器是一个基于Python的网络爬虫项目,集成了Playwright浏览器自动化、DuckDuckGo搜索引擎和MCP协议SDK,用于智能网络数据采集。