Best AI训练数据 AI Tools & Models - Premium AI训练数据 News

AI News

2025 年中国人工智能数据量预计达 199.48EB 同比增长 42.86%

根据国家数据局数据，到2025年中国AI训练与推理数据总量预计达199.48EB，同比增长42.86%。其中推理数据首次超越训练数据，达101.34EB，显示AI应用在各行业的广泛性。同时，系统软件和AI产生的数据量将达26.92ZB。

英伟达吴新宙：自动驾驶的“ChatGPT时刻”已至，L4 级量产不再是梦

英伟达全球副总裁吴新宙近日透露，该公司正以“五层蛋糕”全栈生态布局自动驾驶，涵盖芯片、系统、算法、数据与云平台。L4级自动驾驶预计2025年实现落地。英伟达从芯片商转型为“三台计算机”模式，推动车端推理、训练与仿真协同，加速物理AI在出行领域的商业化进程。

14.5k 33 minutes ago

Meta收集员工日常行为数据用于训练大模型隐私边界再受挑战

Meta推出“模型能力倡议”（MCI），计划利用员工工作行为数据加速大语言模型训练。CEO扎克伯格和首席AI官宣布新模型“Muse Spark”持续进步，但为加快进程，将整合日常工作数据。

12.1k 14 hours ago

Meta 监控员工键鼠操作，旨在训练“AI 办公助手”

Meta被曝通过追踪软件收集员工电脑操作数据，旨在训练AI模型模拟人类办公行为，以推进其“自主AI代理”计划。

10.8k 2 days ago

AI Products

Chatref

无需代码，基于自有数据训练智能AI聊天机器人，快速解决业务问题。

聊天机器人

6.3k

DeepTagger

借助高亮标注界面训练AI，从各类文档中自动提取所需数据。

文档

6.1k

ChatVia.ai

创建基于您自己数据训练的AI代理

聊天机器人

5.4k

Gym Hero

一款专为健身爱好者设计的健身计划与追踪应用，支持AI定制训练和健康数据同步。

个人助理

12.2k

Models

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

wan2.5-t2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-t2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

Kimi-K2

Moonshot

Input tokens/M

$16

Output tokens/M

256

Context Length

Doubao - Seedream - 4.0

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao - Seedream - 3.0 - t2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-SeedEdit-3.0-i2i

Bytedance

Input tokens/M

Output tokens/M

Context Length

Doubao-Seedance-1.0-pro

Bytedance

Input tokens/M

Output tokens/M

Context Length

Qianfan-VL-70B

Baidu

Input tokens/M

Output tokens/M

Context Length

qwen-mt-image

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Nothumanallowed

NotHumanAllowed是一个多智能体认知数据集生成引擎，通过38个专业AI代理进行多轮审议，产生可审计的推理轨迹和结构化知识记录，用于训练下一代AI系统。

开发者工具

7.7k

2.5points

Trainingpeaks Mcp

这是一个通过Model Context Protocol（MCP）将TrainingPeaks训练数据平台连接到Claude等AI助手的服务器。它允许用户通过自然语言查询训练数据、分析训练负荷、比较功率数据并跟踪体能趋势，无需等待官方API审批，使用安全的Cookie认证。

python

6.2k

2.5points

Haskell Hackage Mcp

该项目为AI助手提供访问Haskell文档的接口，通过实时检索Hackage上的权威文档，解决AI在Haskell领域训练数据不足的问题，提升代码生成和解释的准确性。

python

9.4k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

2025 年中国人工智能数据量预计达 199.48EB 同比增长 42.86%

英伟达吴新宙：自动驾驶的“ChatGPT时刻”已至，L4 级量产不再是梦

Meta收集员工日常行为数据用于训练大模型 隐私边界再受挑战

Meta 监控员工键鼠操作，旨在训练“AI 办公助手”

AI Products

Chatref

DeepTagger

ChatVia.ai

Gym Hero

Models

GPT-5 Codex

Claude 3 Opus

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen-image-plus

wan2.5-i2i-preview

qwen3-max

qwen-image-edit

qwen3-livetranslate-flaltimeash-re-2025-09-22

Qwen3-Next-80B-A3B-Instruct

wan2.5-t2v-preview

wan2.5-t2i-preview

wan2.5-i2v-preview

Kimi-K2

Doubao - Seedream - 4.0

Doubao - Seedream - 3.0 - t2i

Doubao-SeedEdit-3.0-i2i

Doubao-Seedance-1.0-pro

Qianfan-VL-70B

qwen-mt-image

Olmo 3 7B Instruct AIO GGUF

Olmo 3 32B Think

Olmo 3 7B RL Zero Math

Olmo 3 7B RL Zero Mix

Trouper 12B GGUF

Olmo 3 1125 32B

Olmo 3 7B Think SFT

Ai Text Detector V N4.0

Apertus 8B Instruct 2509 GGUF

Apertus 8B Instruct 2509 GGUF

Olmo 3 1025 7B

Luth LFM2 700M

Loggenix Moe 0.12B A0.08B E5 Lr5e4 B16 3060 V2 Finetuned

GLM 4 9B 0414

Granite 3.2 2b Instruct GGUF

Soundwave

OpenSight CommunityForensics Deepfake ViT

CommunityForensics DeepfakeDet ViT

Asr Conformer Loquacious

Glm 4 9b Hf

MCP

Nothumanallowed

Trainingpeaks Mcp

Haskell Hackage Mcp

Meta收集员工日常行为数据用于训练大模型隐私边界再受挑战