Best 高性能计算 AI Tools & Models - Premium 高性能计算 News

AI News

OpenAI 发布“美国制造”招募令:全面构建本土 AI 硬件供应链

OpenAI发布提案征集，旨在提升美国本土AI硬件生产能力，以应对全球AI竞争。公司强调AI生态不仅依赖高性能芯片，还需复杂物理硬件支撑。为此，OpenAI正招募美国本土制造商与供应商，提供从核心计算硬件到数据中心冷却系统等关键基础设施组件。

10.3k yesterday

英伟达发布全新“鲁宾”架构：超级芯片 Vera Rubin 现身，AI 算力成本将大幅下降

在2026年CES展上，英伟达发布下一代AI平台“鲁宾”，核心为全新超级芯片Vera Rubin。该平台旨在为智能体AI和大规模推理模型提供更强算力，芯片采用创新集成设计，提升高性能计算效率。

14.6k yesterday

Nvidia 收购 SchedMD 并发布新一代开放 AI 模型，进一步布局开源生态

Nvidia近期收购开源工作负载管理系统Slurm的主要开发者SchedMD，并推出新一代开放AI模型Nemotron 3系列。此举旨在推动开源技术发展，支持高性能计算和人工智能创新。Slurm自2002年推出以来，已成为高性能计算和AI领域的重要工具。

9.7k 3 days ago

英伟达双线出击：收购Slurm强化AI基建，发布Nemotron3 开源模型家族押注智能体未来

英伟达加速构建AI生态，本周宣布收购高性能计算调度系统Slurm开发商SchedMD，并发布开源大模型家族Nemotron 3，全面押注AI智能体与物理智能。Slurm作为全球主流超算调度系统，将强化英伟达基础设施层实力。

10k 20 hours ago

AI Products

Cognitora

专为AI智能体打造的云平台，可自动执行AI生成代码和智能工作负载

开发平台

6.2k

Sesterce Cloud

提供高性能GPU出租服务，包括B200、H200、RTX4090、H100等型号。即时部署，价格透明。

GPU

8.3k

蓝耘元生代MaaS

专注于 GPU 算力云服务，提供高效算力解决方案。

GPU

11.3k

CoreWeave GPU 云计算

专为 AI 设计的 GPU 云平台，提供高性能基础设施和全天候支持。

GPU

11.7k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

qwen-vl-max

Alibaba

$1.6

Input tokens/M

Output tokens/M

128

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

Input tokens/M

Output tokens/M

256

Context Length

GPT-5 mini

Openai

$1.75

Input tokens/M

$14

Output tokens/M

400

Context Length

qwen3-coder-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen-flash

Alibaba

$15

Input tokens/M

$15

Output tokens/M

Context Length

Pangu-NLP-N2-32K-5.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

GLM-4.5-Air

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-TurboS-20250716

Tencent

$0.8

Input tokens/M

Output tokens/M

Context Length

Qwen3-235B-A22B

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Oci Core Services

OCI核心服务FastMCP服务器是一个专为Oracle云基础设施设计的生产级管理工具，提供全面的计算实例生命周期管理、数据库操作和网络信息查询功能，采用LLM优先的设计理念，通过OCI Python SDK实现高性能和可靠性。

python

7.2k

2.0points

Mcpy

MCPy是一个基于Python和Cython的高性能Minecraft服务器引擎，集成了科学计算库和高级优化技术，旨在提供卓越的性能和可扩展性。项目目前处于开发阶段，包含核心模块如服务器引擎、世界生成、网络处理、实体系统和数据持久化。

python

7.3k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

OpenAI 发布“美国制造”招募令:全面构建本土 AI 硬件供应链

英伟达发布全新“鲁宾”架构：超级芯片 Vera Rubin 现身，AI 算力成本将大幅下降

​Nvidia 收购 SchedMD 并发布新一代开放 AI 模型，进一步布局开源生态

​英伟达双线出击：收购Slurm强化AI基建，发布Nemotron3 开源模型家族押注智能体未来

AI Products

Cognitora

Sesterce Cloud

蓝耘元生代MaaS

CoreWeave GPU 云计算

Models

GPT-4.1 mini

o3-mini

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

qwen3-coder-plus

qwen3-vl-plus

Qianfan-Lightning

qwen-image-edit

Hunyuan-T1-latest

qwen-vl-max

gpt-oss-20b

Qwen3-30B-A3B-Instruct-2507

GPT-5 mini

qwen3-coder-flash

qwen-flash

Pangu-NLP-N2-32K-5.0.1.1

GLM-4.5-Air

Hunyuan-TurboS-20250716

Qwen3-235B-A22B

Qwen3 Next 80B A3B Instruct AWQ 4bit

Tencent.Hunyuan MT 7B GGUF

Command A Vision 07 2025

Qwen3 Coder 480B A35B Instruct AWQ

Qwen3 235B A22B Thinking 2507 Mixed 3 5bit

Qwen3 235B A22B GGUF

Llama 3.1 70B Instruct FP8

Ruri Large

Hpc Coder V2 6.7b

2 Bit LLMs

Bge Base En V1.5 Angle

Phi 2 GPTQ

EmbeddingModlebgelargeENv1.5

KoSimCSE Roberta Multitask

MCP

Mcp Oci Core Services

Mcpy

Nvidia 收购 SchedMD 并发布新一代开放 AI 模型，进一步布局开源生态

英伟达双线出击：收购Slurm强化AI基建，发布Nemotron3 开源模型家族押注智能体未来