Human Archive 是一家硅谷初创公司,通过让印度零工从业者佩戴摄像设备,采集第一人称视角视频数据,为AI实验室训练机器人提供稀缺的现实世界行为数据。该公司近日完成融资,获得顶尖AI资本支持,押注这一争议但潜力巨大的领域。
Meta计划利用员工办公数据训练AI,通过追踪鼠标移动、键盘输入等行为,构建更高效的系统。此举显示科技巨头在外部数据枯竭背景下,转向挖掘内部“点击流”数据以提升AI性能。
谷歌利用大语言模型分析全球500万篇新闻报道,挖掘非结构化数据,构建了覆盖全球的山洪预测体系。这一创新方案解决了传统深度学习模型在偏远地区因缺乏历史气象数据而难以预测山洪的难题。
谷歌利用Gemini模型分析全球500万篇新闻报道,尝试预测山洪暴发。山洪作为“气象灾害杀手之首”,每年造成大量伤亡,因其突发性强、范围小,传统监测手段常难以准确预警。这一创新方法旨在通过挖掘新闻数据中的关联信息,提升灾害预警能力。
基于图的科学发现与知识提取
基于代理的框架,用于在复杂信息环境中进行关系抽取。
利用Hacker News历史数据回答关于任何话题的问题
AI搜索与发现解决方案
Openai
-
Input tokens/M
Output tokens/M
Context Length
Anthropic
$105
$525
200
$21
Google
$0.7
$2.8
1k
Alibaba
$6
$24
256
$8
$240
52
Moonshot
$4
$16
Baidu
32
$8.75
$70
400
$1.75
$14
$0.35
Tencent
24
Xai
Huawei
128
avsolatorio
基于BAAI/bge-large-en-v1.5微调的文本嵌入模型,结合MEDI数据集与MTEB分类任务训练集的挖掘三元组训练,无需指令即可直接编码检索查询。
alexyalunin
RuBioRoBERTa 是一个面向俄语生物医学文本挖掘的预训练生物医学语言模型,专门用于处理俄语生物医学领域的文本数据。
SEO MCP是一个基于Ahrefs数据的SEO工具服务,提供反向链接分析、关键词研究、流量估算等功能,通过API获取并缓存数据,支持自动验证码破解。
LinkedIn个人资料数据挖掘MCP服务器,提供高级搜索、资料提取、联系人信息丰富和AI分析功能
这是一个用于访问和分析Google广告透明中心数据的MCP服务器,可查询企业广告活动、分析广告内容(包括图片和视频)、比较不同公司的广告策略,并提供广告效果洞察。