Best 预训练模型 AI Tools & Models - Premium 预训练模型 News

AI News

新技术 HarmonyGNN 显著提升图神经网络准确率

研究人员推出HarmonyGNN训练技术，显著提升图神经网络（GNN）准确性。GNN专门处理由节点和边组成的图形数据，广泛应用于药物发现、天气预测等领域。传统GNN训练依赖半监督学习，而新方法通过优化处理节点间同质性与异质性关系，提高了模型性能。

12.2k yesterday

准确率高达84%！斯坦福研发AI新模型：睡一觉就能预知寿命与疾病

斯坦福大学团队在《自然·医学》发表研究，推出开源AI模型SleepFM。该模型通过分析一晚睡眠监测数据（整合脑电、心电、呼吸等深度生理信号），可预测未来6年健康状况与死亡风险。研究基于25年、6.5万人的临床数据训练，突破了传统智能手表的简单监测功能。

13.1k yesterday

OpenAI内测新模型“Spud”:将关停Sora以整合算力，转型桌面级“超级应用”

OpenAI完成新一代AI模型预训练，代号“Spud”，性能强大，预计数周内发布，有望显著加速全球经济。公司正经历战略收缩与组织重组，由菲吉·西莫领导，迈向通用人工智能（AGI）的关键节点。

15.9k 5 hours ago

小米发布自研MiMo-V2-TTS语音合成大模型，实现多方言与情感深度控制

小米发布自研语音合成大模型Xiaomi MiMo-V2-TTS，在可控、高表现力语音生成方面取得突破。该模型基于自研Audio Tokenizer及多码本架构，通过大规模预训练，实现从宏观风格到微观情绪的精准调节。它能在单句内完成语气转折与情感递变，高度还原人类自然韵律，支持多种语音风格。

13.1k 23 hours ago

AI Products

DataLearner预训练模型平台

提供多种预训练模型，支持多维度筛选，助力AI模型应用与开发。

AI模型

10.6k

Crawl4LLM

一个用于LLM预训练的高效网络爬虫工具，专注于高效爬取高质量网页数据。

开发与工具

12.7k

Magma

Magma 是一个能够理解和执行多模态输入的基础模型，可用于复杂任务和环境。

智能体

11.4k

recurrent-pretraining

大规模深度循环语言模型的预训练代码，支持在4096个AMD GPU上运行。

模型训练与部署

9.2k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

MCP

Linear Regression

线性回归MCP项目展示了使用Claude和模型上下文协议（MCP）的端到端机器学习工作流程，包括数据预处理、模型训练和评估。

python

10.1k

2.5points

Mcp Server Scikit Learn

这是一个为Scikit-learn模型提供标准化接口的MCP服务器，支持模型训练、评估、数据预处理及持久化等功能。

python

9.8k

2.5points

Linear Regression MCP

该项目展示了使用Claude和模型上下文协议(MCP)进行端到端机器学习工作流的线性回归模型训练。用户只需上传CSV数据集，系统即可自动完成数据预处理、模型训练和评估(RMSE计算)全流程。

python

13.1k

2.5points

Pytorch Lightning Mcp

一个将PyTorch Lightning框架通过结构化API暴露给工具、代理和编排系统的MCP服务器，支持训练、检查、验证、测试、预测和模型检查点管理等功能。

python

7.2k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

​新技术 HarmonyGNN 显著提升图神经网络准确率

准确率高达84%！斯坦福研发AI新模型：睡一觉就能预知寿命与疾病

OpenAI内测新模型“Spud”:将关停Sora以整合算力，转型桌面级“超级应用”

小米发布自研MiMo-V2-TTS语音合成大模型，实现多方言与情感深度控制

AI Products

DataLearner预训练模型平台

Crawl4LLM

Magma

recurrent-pretraining

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-max

Qianfan-Lightning

qwen3-vl-235b-a22b-thinking

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

GigaChat3 10B A1.8B GGUF

VideoMAE_kinetics_wlasl_100__signer_20ep_coR

VideoMAE_kinetics_wlasl2000_20epoch_signer

Qwen3 4B Thinking 2507 Gemini 3 Pro Preview High Reasoning Distill

Zenyx_114M Tiny Edu Instruct

MedSwin Merged DaRE TIES KD 0.7

Olmo 3 32B Think

GigaAM V3

Chronoedit

GigaChat3 10B A1.8B Base

Olmo 3 7B RL Zero Mix

Profluent E1 600M

Olmo 3 32B Think SFT

MedSwin Merged TA SFT 0.7

Videomae Tiny 92 Kinetics Binary Finetuned Xd Violence

SDXL Deepfake Detector

Emu3.5

RouWei 0.8 16ch V0.1alpha

Sd15 Flow Matching

Cydonia_Vistral

MCP

Linear Regression

Mcp Server Scikit Learn

Linear Regression MCP

Pytorch Lightning Mcp

新技术 HarmonyGNN 显著提升图神经网络准确率