Best 英伟达 AI Tools & Models - Premium 英伟达 News

AI News

Inception重启！获5000万美元融资推出新一代扩散语言模型Mercury

人工智能初创公司Inception重获新生，完成5000万美元融资，由Menlo Ventures领投，微软M12、英伟达等参投。公司创始人Mustafa Suleyman曾于2024年将公司售予微软，如今再度复活。Inception正押注新型扩散语言模型（dLLM），该架构区别于传统自回归大模型（LLM），有望带来技术突破。

8.4k 8 hours ago

Inception重启！获5000万美元融资推出新一代扩散语言模型Mercury

5000万美元种子轮融资！斯坦福教授创立Inception，用“扩散式大模型”挑战GPT-5，代码生成速度超1000 token/秒

斯坦福教授Stefano Ermon创立的AI初创公司Inception完成5000万美元种子轮融资，获Menlo Ventures领投，微软、英伟达等巨头跟投，吴恩达等AI大咖天使投资。公司以颠覆性架构突破当前自回归模型竞争格局，引发行业关注。

9.6k 7 hours ago

5000万美元种子轮融资！斯坦福教授创立Inception，用“扩散式大模型”挑战GPT-5，代码生成速度超1000 token/秒

Inception 重返 AI 赛道，50百万美元融资助推新模型崛起

AI初创公司Inception获5000万美元融资，由Menlo Ventures领投，微软、英伟达等参投。创始人Mustafa Suleyman曾将公司售予微软后专注写作，现公司重点转向扩散模型（dLLMs），与传统自回归大语言模型形成技术差异。

5.2k 7 hours ago

Inception 重返 AI 赛道，50百万美元融资助推新模型崛起

OpenAI 与 AWS 达成380亿美元协议，构建 AI 基础设施新格局

OpenAI与AWS签署价值380亿美元、为期七年的合作协议，将获得数十万台英伟达GPU计算资源，托管于亚马逊全球数据中心。此举强化了OpenAI在AI领域的基础设施布局，超越传统云服务租赁模式。

OpenAI 与 AWS 达成380亿美元协议，构建 AI 基础设施新格局

Models

Nvidia_Qwen3 Nemotron 32B RLBFF GGUF

bartowski

这是英伟达Qwen3-Nemotron-32B-RLBFF大语言模型的GGUF量化版本，使用llama.cpp工具进行多种精度量化，提供从BF16到IQ2_XXS共20多种量化选项，适用于不同硬件配置和性能需求。

自然语言处理

Gguf

OpenReasoning Nemotron 14B GGUF

lmstudio-community

这是英伟达OpenReasoning Nemotron 14B的量化版本，由bartowski基于llama.cpp提供GGUF量化。

自然语言处理

Gguf

lmstudio-community

OpenReasoning Nemotron 7B GGUF

lmstudio-community

这是英伟达OpenReasoning Nemotron 7B模型的GGUF量化版本，专门用于文本生成任务。该模型通过LM Studio社区模型亮点计划提供，支持高效的推理和部署。

自然语言处理

Gguf

lmstudio-community

AceReason Nemotron 1.1 7B GGUF

lmstudio-community

英伟达推出的高性能7B参数语言模型，专注于数学和代码推理任务，支持128k上下文长度。

自然语言处理

Gguf

GgufMultiple Languages

lmstudio-community

AceReason Nemotron 7B GGUF

lmstudio-community

基于英伟达AceReason-Nemotron-7B的GGUF量化版本，专注于数学与代码推理，支持128k tokens长上下文

自然语言处理

Gguf

GgufMultiple Languages

lmstudio-community

AceReason Nemotron 14B GGUF

lmstudio-community

基于英伟达AceReason-Nemotron-14B的GGUF量化版本，专注于数学与代码推理任务，支持128k tokens长上下文

自然语言处理

Gguf

GgufMultiple Languages

lmstudio-community

Nvidia.Cosmos Reason1 7B GGUF

DevQuasar

Cosmos-Reason1-7B是英伟达发布的7B参数规模的基础模型，专注于图文转文本任务。

自然语言处理

Gguf

Llama 3.1 Nemotron Nano 4B V1.1 GGUF

lmstudio-community

由英伟达发布的4B参数规模大语言模型，支持128k tokens上下文长度，专为推理、对话及RAG等任务优化

自然语言处理

Gguf

lmstudio-community

Nemotron H 56B Base 8K

nvidia

Nemotron-H-56B-Base-8K是英伟达开发的大型语言模型，采用混合Mamba-Transformer架构，支持8K上下文长度和多语言文本生成。

自然语言处理

Transformers

TransformersMultiple Languages

GR00T N1 2B

nvidia

英伟达Isaac GR00T N1是全球首个面向通用人形机器人推理与技能的开源基础模型，具有20亿参数规模。

Safetensors

Nvidia_AceInstruct 7B GGUF

bartowski

基于英伟达AceInstruct-7B模型的量化版本，使用llama.cpp进行量化，支持多种量化类型，适用于代码、数学和通用领域任务。

自然语言处理

Gguf

GgufMultiple Languages

AceMath 7B Instruct

nvidia

AceMath-7B-Instruct是英伟达推出的专为数学推理设计的指导模型，基于改进版Qwen架构开发，擅长通过思维链(CoT)推理解决英文数学问题。

自然语言处理

Safetensors

SafetensorsEnglish

Open Insurance LLM Llama3 8B GGUF

Raj-Maharajwala

基于英伟达Llama 3 - ChatQA的保险领域特定语言模型的GGUF量化版本，针对保险相关的查询和对话进行了微调。

自然语言处理

Transformers

TransformersEnglish

Raj-Maharajwala

Llama 3.1 Nemotron 70B Instruct HF

nvidia

英伟达定制的大型语言模型，旨在提升大语言模型生成回复对用户查询的有用性。

自然语言处理

Transformers

TransformersEnglish

Nemotron Mini 4B Instruct

nvidia

Nemotron-Mini-4B-Instruct是英伟达开发的专为角色扮演、检索增强生成和函数调用优化的响应生成模型，基于Minitron-4B-Base微调，支持4096个token的上下文长度。

自然语言处理

Transformers

TransformersEnglish

AIBase

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

© 2025AIBase

Business Cooperation Site Map