Best 模型优化 AI Tools & Models - Premium 模型优化 News

AI News

谷歌Nano Bana Pro模型首秀:NotebookLM新增幻灯片和信息图功能

谷歌AI笔记工具NotebookLM新增幻灯片生成器功能，可将笔记快速转换为演示幻灯片，帮助用户高效整理内容、生成草稿并优化视觉效果。该功能与信息图工具均基于Gemini3Pro图像生成模型运行，能处理详细提示信息。

阿里千问启用全新域名qianwen.com，提供更多模型选择

11月24日，阿里AI助手“千问”启用新域名qianwen.com，网页端与App端体验一致。面向专业用户开放Qwen3系列模型，如Qwen3-Max-Thinking-Preview和Qwen3-Coder等十余款，并提供代码、深度研究等PC端优化功能，提升访问便捷性和使用体验。

8.9k 8 minutes ago

微软推出 AI 驱动的复制粘贴功能，实现本地 AI 处理

微软升级“高级粘贴”功能，改用本地AI模型替代云端处理，提升文本数据处理效率。此举利用设备计算能力，在保护用户隐私的同时，提供智能识别支持，优化复制粘贴体验，提高工作效率。

6.6k 8 hours ago

谷歌 Gemini 3 Pro Preview模型上线 AI Studio 开发者可灵活调整参数

谷歌发布Gemini3大型语言模型，其Pro Preview版已在AI Studio平台开放体验。该平台面向开发者、研究人员和学生，支持基于Gemini模型开发应用，并提供上下文长度、温度等参数灵活调整功能，便于优化模型配置。

9.1k 49 minutes ago

AI Products

Lucent Chat

集成多AI模型，可通过对话生成图像、视频和声音，优化创意流程。

AI设计工具

6.1k

First Answer

AI搜索可见性平台，帮助品牌优化在ChatGPT、Perplexity、Google AI等LLM中的表现。

AI搜索

4.7k

Snowglobe

Snowglobe帮助AI团队在规模上测试LLM应用。在推出之前模拟真实对话，发现风险并提高模型性能。

模型训练与部署

6.4k

SiliconFlow

为开发者提供快速的AI平台，部署、优化和运行200多个LLM和多模型。

模型训练与部署

7.6k

Models

o4-mini (high)

openai

$7.92

Input tokens/M

$31.68

Output tokens/M

200k

Context Length

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

nvidia

Input tokens/M

Output tokens/M

128k

Context Length

HunYuan-TurboS

tencent

$0.8

Input tokens/M

Output tokens/M

32k

Context Length

o1-pro

openai

Input tokens/M

Output tokens/M

200k

Context Length

Hunyuan-T1-20250403

tencent

Input tokens/M

Output tokens/M

64k

Context Length

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

nvidia

Input tokens/M

Output tokens/M

128k

Context Length

Sonar Reasoning

perplexity

Input tokens/M

Output tokens/M

127k

Context Length

Reka Flash 3

reka-ai

Input tokens/M

Output tokens/M

128k

Context Length

GPT-5-Nano

openai

$0.36

Input tokens/M

$2.88

Output tokens/M

400k

Context Length

ERNIE-X1-Turbo-32K

baidu

Input tokens/M

Output tokens/M

32k

Context Length

Gemini 2.5 Flash-Lite

google

$0.72

Input tokens/M

$2.88

Output tokens/M

Context Length

Hunyuan-TurboS-Vision

tencent

Input tokens/M

Output tokens/M

Context Length

Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

nvidia

Input tokens/M

Output tokens/M

128k

Context Length

Gemini 1.5 Pro (Sep '24)

google

$18

Input tokens/M

$72

Output tokens/M

Context Length

Sonar

perplexity

Input tokens/M

Output tokens/M

127k

Context Length

Sonar Pro

perplexity

Input tokens/M

Output tokens/M

200k

Context Length

Gemini 2.0 Flash-Lite (Feb '25)

google

$0.58

Input tokens/M

$2.16

Output tokens/M

Context Length

Llama 3.3 Instruct 70B

Gemini 2.0 Flash-Lite (Preview)

google

$0.58

Input tokens/M

$2.16

Output tokens/M

Context Length

Baichuan4-Turbo

baichuan

Input tokens/M

Output tokens/M

192k

Context Length

MCP

Osp_marketing_tools

Open Strategy Partners (OSP) 提供了一套全面的营销工具套件，用于技术营销内容创建、优化和产品定位，基于其验证的方法论和模型上下文协议(MCP)。

python

27.2k

3.0points

Mindmesh Mcp Server

一个基于量子场计算模型的Claude多实例协同推理服务器，通过场一致性优化实现增强型AI推理能力。

typescript

5.7k

2.5points

Mcp Graphiti

Graphiti MCP Server是一个基于多项目知识图谱的服务器，支持快速构建和管理临时知识图谱，供AI代理通过模型上下文协议查询。该项目扩展了官方getzep/graphiti MCP服务器，增加了多服务器单数据库支持，并提供了开发者体验优化的CLI工具。

python

10.2k

2.5points

Interact Mcp

交互式反馈MCP项目，通过集成模型上下文协议（MCP）在关键点提供智能交互反馈，优化AI助手的用户交互流程，减少资源消耗并提升性能。

python

2.5points

Lotus Mcp

LOTUS-MCP是一个开源的模型协调协议，整合Mistral和Gemini两大AI模型，提供统一接口、上下文共享和工具集成，实现智能路由和成本优化。

python

31.5k

2.5points

Ibproduct_ib Mcp Cache Server

一个基于MCP协议的内存缓存服务器，通过高效缓存语言模型交互数据来减少token消耗，支持自动管理和配置优化。

typescript

5.6k

2.5points

Circuit Mcp

Snowfort Circuit MCP是一个全面的模型上下文协议服务器套件，为AI编码代理提供网页和Electron桌面应用自动化能力，具有AI优化的快照、智能截图压缩和多会话管理等功能。

typescript

2.5points

PhialsBasement_Pagespeed MCP Server

PageSpeed MCP服务器是一个连接AI助手与谷歌PageSpeed Insights API的桥梁，为AI模型提供网站性能分析功能，包括核心性能指标、SEO评估、可访问性审计和资源优化建议。

javascript

6.1k

2.5points

Ollama MCP Server

Ollama-MCP-server是一个连接本地Ollama LLM实例与MCP兼容应用的协议服务器，提供任务分解、结果评估、模型管理等功能，支持标准化通信和性能优化。

python

9.1k

2.5points

AI Humanizer MCP Server

AI Humanize MCP Server是一个强大的模型上下文协议服务器，能够将AI生成的内容优化得更自然、更人性化。它具备AI检测、自然语言增强、语法修正、可读性优化等功能，帮助用户提升文本质量。

typescript

8.6k

2.5points

Context_engineering_mcp

Context Engineering MCP平台是一个AI上下文管理与优化平台，通过系统化的方法设计、管理和优化AI模型的输入信息，实现提示工程的工程化。平台提供智能分析引擎、优化算法、模板管理等功能，显著提升AI响应质量、降低API成本，并支持多模态内容处理。

python

6.4k

2.5points

Mcp Thought Server

MCP Thought Server是一个为AI代理提供高级思维工具的服务，通过模型上下文协议（MCP）增强推理、规划和迭代优化能力。它包含结构化思维、迭代草稿和集成思维等工具，支持SQLite持久化和高级置信度评分系统，可配置环境变量以适应不同需求。

typescript

7.4k

2.5points

Dap_mcp

dap-mcp是一个基于模型上下文协议（MCP）的调试适配器协议（DAP）实现，旨在优化和扩展大型语言模型的上下文窗口，以增强调试工作流程。

python

6.5k

2.5points

Unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化算法和4位量化技术，实现2倍训练速度提升和80%显存节省，支持多种主流模型。

typescript

8.6k

2.5points

Mcp Framework

MCP开发框架是一个用于创建与大语言模型交互自定义工具的强大框架，提供文件处理、网页内容获取等功能，支持PDF、Word、Excel等多种格式，具有智能识别、高效处理和内存优化等技术特点。

python

9.6k

2.5points

Ultimate_mcp_server

Ultimate MCP Server是一个基于模型上下文协议(MCP)的AI代理操作系统，提供数十种强大工具能力，包括认知增强、工具使用和智能编排等功能。该系统通过标准化MCP工具暴露功能，使高级AI代理能访问丰富的工具生态系统和专业化服务，同时优化成本、性能和质量。

python

8.8k

2.5points

Jij Mcp Server

Jij MCP服务器是一个提供数学优化和量子计算支持的工具平台，集成了JijModeling建模工具和Qiskit量子编程框架，提供代码检查、模型创建、版本迁移指南等功能。

python

6.2k

2.5points

Unsloth

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化技术实现2倍速度提升和80%内存节省。

typescript

8.2k

2.5points

Debug Adapter Protocol (DAP)

dap-mcp是一个基于MCP协议的DAP会话管理工具，旨在优化和扩展大型语言模型的上下文窗口，提升调试工作流。

python

8.4k

2.5points

Alphavantage_mcp

Alpha Vantage MCP是一个提供股票和金融数据访问的模型上下文协议服务器，整合了Alpha Vantage所有API端点功能，并通过优化端点组织减少上下文窗口使用。

typescript

6.7k

2.5points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

谷歌Nano Bana Pro模型首秀:NotebookLM新增幻灯片和信息图功能

阿里千问启用全新域名qianwen.com，提供更多模型选择

微软推出 AI 驱动的复制粘贴功能，实现本地 AI 处理

​谷歌 Gemini 3 Pro Preview模型上线 AI Studio 开发者可灵活调整参数

AI Products

Lucent Chat

First Answer

Snowglobe

SiliconFlow

Models

o4-mini (high)

Llama 3.1 Nemotron Ultra 253B v1 (Reasoning)

HunYuan-TurboS

o1-pro

Hunyuan-T1-20250403

Llama 3.3 Nemotron Super 49B v1 (Reasoning)

Sonar Reasoning

Reka Flash 3

GPT-5-Nano

ERNIE-X1-Turbo-32K

Gemini 2.5 Flash-Lite

Hunyuan-TurboS-Vision

Llama 3.1 Nemotron Nano 4B v1.1 (Reasoning)

Gemini 1.5 Pro (Sep '24)

Sonar

Sonar Pro

Gemini 2.0 Flash-Lite (Feb '25)

Llama 3.3 Instruct 70B

Gemini 2.0 Flash-Lite (Preview)

Baichuan4-Turbo

Cerebras.MiniMax M2 REAP 172B A10B GGUF

Emotion Classifier V2 GGUF

Qwen3 30B A3B Thinking 2507 Claude 4.5 Sonnet High Reasoning Distill GGUF

Trouper 12B GGUF

Seed OSS 36B Instruct Unsloth MXFP4 Hybrid GGUF

Qwen3 VLTO TNG 12B 256k NEO Imatrix GGUF

Prima 24B Q4_K_M GGUF

VideoMAE_Base_wlasl_100_longtail_200

Tarka Embedding 350M V1

Qwen3 Coder 30B A3B Instruct F32

Marvis Tts 100m V0.2 MLX 6bit

Nutrient Gram Qwen 3 Vl 2b

NV Reason CXR 3B GGUF

Kanana 1.5 15.7b A3b Instruct MXFP4_MOE GGUF

Fine_Tunned_LLM

Qwen3 VL 30B A3B Instruct Q8_0 GGUF

Tarka Embedding 150M V1

Qwen3 Coder 480B A35B Instruct MLX 8.5bit

YanoljaNEXT Rosetta 27B 2511 GGUF

AllThingsIntel_Apollo V0.1 4B Thinking GGUF

MCP

Osp_marketing_tools

Mindmesh Mcp Server

Mcp Graphiti

Interact Mcp

Lotus Mcp

Ibproduct_ib Mcp Cache Server

Circuit Mcp

PhialsBasement_Pagespeed MCP Server

Ollama MCP Server

AI Humanizer MCP Server

Context_engineering_mcp

Mcp Thought Server

Dap_mcp

Unsloth Mcp Server

Mcp Framework

Ultimate_mcp_server

Jij Mcp Server

Unsloth

Debug Adapter Protocol (DAP)

Alphavantage_mcp

谷歌 Gemini 3 Pro Preview模型上线 AI Studio 开发者可灵活调整参数