Best 长尾问题 AI Tools & Models - Premium 长尾问题 News

AI News

豆包团队开源SuperGPQA：挑战285学科AI推理极限

近日，字节跳动豆包大模型团队联合M-A-P开源社区发布SuperGPQA，一个覆盖285个研究生级学科、包含26，529道专业问题的知识推理基准测试。该数据集不仅涵盖数学、物理等主流学科，还首次将轻工业、农业、服务科学等长尾学科纳入评估体系，填补了现有基准测试在长尾知识领域的空白。SuperGPQA已被用于揭示开源与闭源模型的性能差距，成为AI发展的重要工具。传统基准如MMLU和GPQA学科覆盖不足50个，长尾学科占比不到5%，且因数据来源单一（如维基百科）和众包标注不可靠，难以衡量模型在

18.1k 8 hours ago

王小川的大模型寄托，仍然是搜索

["百川智能发布了 Baichuan-53B，一个闭源大模型，引入了搜索增强系统。","大模型面临即时性和长尾知识的问题，而搜索增强可以辅助大模型获取更全面的信息。","王小川和百川智能将搜索与大模型的融合作为未来的发展重点。"]

8.4k 07-13

Models

Doubao - Seedream - 4.0

Bytedance

Input tokens/M

Output tokens/M

Context Length

Hunyuan-T1-latest

Tencent

Input tokens/M

Output tokens/M

Context Length

qwen-deep-research

Alibaba

$54

Input tokens/M

$163

Output tokens/M

Context Length

GPT-5

Openai

$8.75

Input tokens/M

$70

Output tokens/M

400

Context Length

Spark X1

Iflytek

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-thinking-pro

Bytedance

Input tokens/M

$16

Output tokens/M

128

Context Length

Gemini 2.5 Pro

Google

$8.75

Input tokens/M

$70

Output tokens/M

Context Length

Claude Opus 4

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini Diffusion

Google

Input tokens/M

Output tokens/M

Context Length

o3

Openai

$14

Input tokens/M

$56

Output tokens/M

200

Context Length

GPT-4.5

Openai

$525

Input tokens/M

$1050

Output tokens/M

128

Context Length

Grok-3

Xai

$21

Input tokens/M

$105

Output tokens/M

128

Context Length

Hunyuan-Standard

Tencent

$0.8

Input tokens/M

Output tokens/M

Context Length

DeepSeek-R1-Distill-Qwen-32B

Deepseek

Input tokens/M

Output tokens/M

Context Length

Gemini 2.0 Flash Thinking

Google

Input tokens/M

Output tokens/M

Context Length

GLM-Z1-Air

Chatglm

Input tokens/M

Output tokens/M

128

Context Length

Hunyuan-Vision

Tencent

$18

Input tokens/M

$18

Output tokens/M

Context Length

Baichuan2-53B

Baichuan

$15

Input tokens/M

$15

Output tokens/M

Context Length

o1-preview

Openai

$105

Input tokens/M

$420

Output tokens/M

128

Context Length

Grok-1.5V

Xai

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map