Best 量化 AI Tools & Models - Premium 量化 News

AI News

AI日报：Seedance2.0紧急暂停真人参考功能；Qwen-Image-2.0发布；混元推首个产业级2Bit端侧模型

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、腾讯混元推出首个产业级2Bit端侧模型:0.3B体量实现性能逆袭腾讯混元推出首个产业级2Bit端侧模型HY-1.8B-2Bit，通过创新的量化感知训练技术，在大幅压缩模型体积的同时保持了强大的性能和全科能力，适用于手机、耳机及智能家居等对隐私要求高的场景。微软也正在入场，争夺高质量数据资源的控制权。

24.3k 7 hours ago

AI日报：Seedance2.0紧急暂停真人参考功能；Qwen-Image-2.0发布；混元推首个产业级2Bit端侧模型

腾讯混元推出首个产业级2Bit端侧模型:0.3B体量实现性能逆袭

腾讯混元发布极小模型HY-1.8B-2Bit，通过产业级2Bit量化方案将等效参数量降至0.3B，内存占用仅约600MB，体积小于部分手机应用。该技术突破传统量化方法，解决了低位数量化精度损失大的难题，为大模型在消费级硬件上的高效部署提供了新路径。

14.3k 13 hours ago

李飞飞联手光轮智能，打造具身智能“评测基建”：仿真驱动机器人进入可量化时代

具身智能评估迎来突破。李飞飞创立的World Labs与光轮智能合作，共建全球首个高保真、可扩展评测体系，推动领域从“演示驱动”转向“评测驱动”，旨在科学、高效、规模化地评估机器人智能水平。

12.3k yesterday

华图山鼎AI破局公考申论批改：2分钟精准评卷，OMO模式重塑教育培训体验

华图山鼎运用自研AI技术，革新公务员考试培训中的申论批改环节。传统人工评阅存在反馈慢、成本高、标准不一等痛点。该AI系统将主观评判转化为可量化、可追溯的智能评估，推动教培服务向高效、精准、个性化升级。

10k 5 days ago

AI Products

SmolVLM2

SmolVLM2 是一个专注于视频内容分析和生成的轻量化语言模型。

视频编辑

13.1k

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

这是一个基于Qwen2.5-32B模型的4位量化版本，专为高效推理和低资源部署设计。

聊天机器人

9.8k

InternLM3

InternLM3 是一个专注于文本生成的模型集合，提供多种优化版本以满足不同需求。

AI模型

9.6k

Llama-3-Patronus-Lynx-8B-Instruct-Q4_K_M-GGUF

基于特定模型的量化大型语言模型，适用于自然语言处理等任务。

AI模型

10.5k

Models

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

gpt-oss-20b

Openai

$0.4

Input tokens/M

Output tokens/M

128

Context Length

Pangu-NLP-N2-32K-5.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

GLM-4.5-Air

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-A13B

Tencent

$0.5

Input tokens/M

Output tokens/M

224

Context Length

Hunyuan-Translation-Lite

Tencent

Input tokens/M

Output tokens/M

Context Length

Doubao-embedding

Bytedance

$0.5

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

Huawei

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N4-4K-3.2.36

Huawei

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-1.5B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_0.5b_base

Alibaba

Input tokens/M

Output tokens/M

128

Context Length

Pangu-NLP-N2-32K-3.1.35

Huawei

Input tokens/M

Output tokens/M

Context Length

Pangu-NLP-N4-32K-2.5.35

Huawei

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Large-Longcontext

Tencent

Input tokens/M

$18

Output tokens/M

256

Context Length

ERNIE 4.5 Turbo

Baidu

$0.8

Input tokens/M

$3.2

Output tokens/M

128

Context Length

Qwen_v2_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Yi-Lightning

01-ai

$0.99

Input tokens/M

$0.99

Output tokens/M

Context Length

ERNIE-4.5-21B-A3B-Paddle

Baidu

Input tokens/M

Output tokens/M

Context Length

ERNIE-4.5-0.3B

Baidu

$0.1

Input tokens/M

$0.4

Output tokens/M

128

Context Length

MCP

XTQuant AI

XTQuantAI是一个基于MCP协议的服务器，将迅投量化平台与AI助手集成，实现AI直接访问和操作量化交易数据。

python

17k

2.5points

Fastmcp Godot Rag

基于检索增强生成(RAG)的Godot文档查询助手，通过向量化技术和语义搜索实现智能问答

python

7.7k

2.5points

MCPAgentRE

MCP_Agent:RE是一个用于从TAPD平台获取需求和缺陷数据并生成质量分析报告的Python项目，提供数据获取、预处理、向量化、智能搜索和报告生成等完整工具链，支持AI驱动的测试管理。

python

6.5k

2.5points

DuckDB RAG MCP Sample

一个使用DuckDB和Plamo-Embedding-1B实现RAG功能的项目，支持markdown文件向量化存储和检索，并提供MCP服务接口。

python

9.4k

2.5points

Vibe Eyes

Vibe-Eyes是一个MCP服务器项目，通过向量化画布可视化和调试信息，使LLM能够'看到'基于浏览器的游戏和应用程序中发生的事情。

javascript

9.1k

2.5points

Eips Mcp

一个MCP服务器，通过语义搜索为AI代理提供相关的以太坊改进提案(EIP)内容，支持Markdown文档处理和向量化检索。

python

2.5points

Unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务器，通过优化算法和4位量化技术，实现2倍训练速度提升和80%显存节省，支持多种主流模型。

typescript

9.3k

2.5points

Mcp Code Indexer

MCP代码索引器是一个专为AI大语言模型设计的智能代码检索工具，通过语义理解和向量化索引提升代码处理效率和准确性，支持代码分析、质量评估和依赖管理等功能。

python

10.6k

2.5points

Quantconnect Mcp

QuantConnect MCP Server是一个专为量化交易设计的本地化模型上下文协议服务器，提供完整的QuantConnect平台集成，包括研究环境、统计分析、组合优化等功能，支持通过自然语言与AI助手交互进行量化策略开发。

python

8.2k

2.5points

FinQ4Cn Mcp Server

FinQ4Cn-mcp-server是一个基于akshare库的金融数据服务工具，专注于中国A股市场，提供股票及相关金融产品的多维度数据支持，适用于量化分析和国内股票市场研究。

python

11.7k

2.5points

Docs_mcp

一个基于Bevy英文文档的相似度搜索MCP工具，通过将HTML文档转换为Markdown并向量化存储，实现智能文档查询功能。

python

2.5points

Crypto Indicators Mcp

一个提供加密货币技术分析指标和交易策略的MCP服务器，支持AI交易代理进行市场趋势分析和量化策略开发。

javascript

9.6k

2.5points

OtotaO_unsloth Mcp Server

Unsloth MCP Server是一个用于高效微调大语言模型的服务，基于Unsloth库实现2倍加速和80%内存节省，支持多种模型和量化技术。

typescript

7.9k

2.0points

Montewalk

MonteWalk是一个基于MCP协议的机构级量化交易工具服务器，为AI助手提供实时市场数据、投资组合管理、风险分析和回测功能，包含25+工具和6个智能工作流，通过Gradio 6界面提供专业交易终端体验。

python

4.8k

2.0points

Mcp Brain Server

Brain Server是一个基于MCP协议的知识嵌入与向量搜索服务，提供高质量文本向量化、语义搜索和知识管理功能，支持多种嵌入模型和Docker部署。

typescript

8.7k

2.0points

LibraryAI

一个AI知识库与数据处理项目，包含向量数据库处理、MCP协议支持及核心功能库，支持文本分块、向量化搜索和调试工具。

csharp

2.0points

Qdrant Mcp Server

一个基于MCP框架的Qdrant向量数据库服务，提供文本向量化存储与相似性搜索功能。

python

9.4k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

AI日报：Seedance2.0紧急暂停真人参考功能；Qwen-Image-2.0发布；混元推首个产业级2Bit端侧模型

腾讯混元推出首个产业级2Bit端侧模型:0.3B体量实现性能逆袭

李飞飞联手光轮智能，打造具身智能“评测基建”：仿真驱动机器人进入可量化时代

华图山鼎AI破局公考申论批改：2分钟精准评卷，OMO模式重塑教育培训体验

AI Products

SmolVLM2

QwQ-32B-Preview-gptqmodel-4bit-vortex-v3

InternLM3

Llama-3-Patronus-Lynx-8B-Instruct-Q4_K_M-GGUF

Models

Grok 4 Fast

gpt-oss-20b

Pangu-NLP-N2-32K-5.0.1.1

GLM-4.5-Air

Hunyuan-A13B

Hunyuan-Translation-Lite

Doubao-embedding

Pangu-NLP-N2-Reasoner-32K-3.0.1.1

Pangu-NLP-N4-4K-3.2.36

DeepSeek-R1-Distill-Qwen-1.5B

Qwen_v2.5_0.5b_base

Pangu-NLP-N2-32K-3.1.35

Pangu-NLP-N4-32K-2.5.35

Hunyuan-Large-Longcontext

ERNIE 4.5 Turbo

Qwen_v2_1.5b_Instruct

Qwen_v2.5_3b_Instruct

Yi-Lightning

ERNIE-4.5-21B-A3B-Paddle

ERNIE-4.5-0.3B

Qwen.Qwen3 VL 32B Thinking GGUF

GPT OSS Cybersecurity 20B Merged I1 GGUF

TheDrummer_Magidonia 24B V4.3 GGUF

TheDrummer_Cydonia 24B V4.3 GGUF

Hermes 4.3 36B GGUF

Qwen3 4B Hivemind Instruct NEO MAX Imatrix GGUF

Mistralai_Mistral Large 3 675B Instruct 2512 GGUF

Hito 1.7b GGUF

Z Image Turbo FP8

Qwen3 VL 32B Thinking Heretic GGUF

FLUX.2 Dev Fp8_scaled

Microsoft_Fara 7B GGUF

Osgrep Colbert Q8

ArliAI_GLM 4.5 Air Derestricted GGUF

FLUX.2 Dev Bnb 4bit

Squ11z1_Hypnos I1 8B GGUF

GLM 4.5 Air Derestricted Qx53g Mlx

Qwen3 Next 80B A3B Instruct 4bit SINQ

Gemma 3 12b It Qat Mlx Mxfp4

Miromind Ai_MiroThinker V1.0 8B GGUF

MCP

XTQuant AI

Fastmcp Godot Rag

MCPAgentRE

DuckDB RAG MCP Sample

Vibe Eyes

Eips Mcp

Unsloth Mcp Server

Mcp Code Indexer

Quantconnect Mcp

FinQ4Cn Mcp Server

Docs_mcp

Crypto Indicators Mcp

OtotaO_unsloth Mcp Server

Montewalk

Mcp Brain Server

LibraryAI

Qdrant Mcp Server