最好的長尾問題 AI工具模型_精選長尾問題資訊

AI資訊

豆包團隊開源SuperGPQA：挑戰285學科AI推理極限

近日，字節跳動豆包大模型團隊聯合M-A-P開源社區發佈SuperGPQA，一個覆蓋285個研究生級學科、包含26，529道專業問題的知識推理基準測試。該數據集不僅涵蓋數學、物理等主流學科，還首次將輕工業、農業、服務科學等長尾學科納入評估體系，填補了現有基準測試在長尾知識領域的空白。SuperGPQA已被用於揭示開源與閉源模型的性能差距，成爲AI發展的重要工具。傳統基準如MMLU和GPQA學科覆蓋不足50個，長尾學科佔比不到5%，且因數據來源單一（如維基百科）和衆包標註不可靠，難以衡量模型在

18.5k 4 天前

王小川的大模型寄託，仍然是搜索

["百川智能發佈了 Baichuan-53B，一個閉源大模型，引入了搜索增強系統。","大模型面臨即時性和長尾知識的問題，而搜索增強可以輔助大模型獲取更全面的信息。","王小川和百川智能將搜索與大模型的融合作爲未來的發展重點。"]

8.5k 6 天前

模型

Grok 4 Fast

Xai

$1.4

輸入tokens/百萬

$3.5

輸出tokens/百萬

上下文長度

Claude Sonnet 4.5

Anthropic

$21

輸入tokens/百萬

$105

輸出tokens/百萬

200

上下文長度

qwen-image-plus

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen3-vl-235b-a22b-thinking

Alibaba

輸入tokens/百萬

$20

輸出tokens/百萬

上下文長度

Doubao - Seedream - 4.0

Bytedance

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen-vl-plus

Alibaba

$0.8

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Qianfan-VL-70B

Baidu

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-T1-latest

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Hunyuan-T1-20250822

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

qwen-deep-research

Alibaba

$54

輸入tokens/百萬

$163

輸出tokens/百萬

上下文長度

Qwen3-30B-A3B-Instruct-2507

Alibaba

$0.75

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

GPT-5

Openai

$8.75

輸入tokens/百萬

$70

輸出tokens/百萬

400

上下文長度

Pangu-NLP-N2-128K-5.0.1.1

Huawei

輸入tokens/百萬

輸出tokens/百萬

128

上下文長度

Hunyuan-Large-Vision

Tencent

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Doubao-Seed-1.6-thinking

Bytedance

$0.8

輸入tokens/百萬

輸出tokens/百萬

256

上下文長度

Spark X1

Iflytek

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Doubao-1.5-thinking-pro

Bytedance

輸入tokens/百萬

$16

輸出tokens/百萬

128

上下文長度

qwen-mt-plus

Alibaba

$1.8

輸入tokens/百萬

$5.4

輸出tokens/百萬

上下文長度

星火醫療大模型 - Lite

Iflytek

輸入tokens/百萬

輸出tokens/百萬

上下文長度

Qwen3-235B-A22B

Alibaba

輸入tokens/百萬

輸出tokens/百萬

上下文長度

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

友情链接:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

商務合作網站地圖