Best 场景语言 AI Tools & Models - Premium 场景语言 News

AI News

支付宝首发ACT协议，打造中国首个AI智能体商业协同标准，支付安全与自动化体验兼得

支付宝推出中国首个AI智能体商业开放协议ACT，旨在构建跨平台协同的通用语言与信任机制，解决智能体在订餐、理财等场景中高效可信协作的关键难题。

15.9k 3 hours ago

谷歌翻译迎来革命性升级：耳机秒变实时翻译器，Gemini加持让对话“原声重现”

谷歌翻译应用测试版新增实时语音翻译功能，用户佩戴任意耳机即可听到保留原说话者语气、重音与语调的精准翻译，将普通耳机变为单向同声传译设备。该功能旨在满足国外听讲座、与当地人交流等真实场景下的深层语言需求。

12.9k 6 hours ago

英伟达发布开放式推理 AI 助力自动驾驶技术迈向新台阶

英伟达在NeurIPS大会上发布自动驾驶AI模型Alpamayo-R1（AR1），这是全球首个行业级开放推理视觉语言行动模型。它能同时处理文本和图像，将传感器信息转化为自然语言描述，结合推理链AI和路径规划技术，以应对复杂驾驶场景，加速无人驾驶汽车发展。

14.5k 4 days ago

Gemini TTS 2.5正式上线：Google推情绪级语音，24语种+多角色一键切换

Google推出Gemini 2.5 Flash与Pro文本转语音预览模型，全面升级5月旧版。新模型支持24种语言的多角色对话，具备“情绪级”表达和自适应节奏功能，用户可一键切换“欢快乐观”或“阴郁严肃”等音色。开发者现可在Google AI Studio与Playground免费测试，预计2025年第一季度投入生产，适用于有声书、游戏NPC及本地化课程等场景。

16.3k 26 minutes ago

Gemini TTS 2.5正式上线：Google推情绪级语音，24语种+多角色一键切换

AI Products

Aya Vision

Aya Vision 是 Cohere 推出的多语言多模态视觉模型，旨在提升多语言场景下的视觉和文本理解能力。

AI模型

10.2k

Gemini 2.0 Flash-Lite

Gemini 2.0 Flash-Lite 是高效的语言模型，专为长文本处理和多种应用场景优化。

AI模型

10.1k

百宝箱Tbox

基于支付宝的生活场景，通过领先的大模型技术，为企业快速构建专业级智能体。

智能体

15.5k

Mistral-Small-24B-Instruct-2501

Mistral Small 24B 是一款多语言、高性能的指令微调型大型语言模型，适用于多种应用场景。

聊天机器人

9.3k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen-image-plus

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

wan2.5-i2i-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

qwen-image-edit

Alibaba

Input tokens/M

Output tokens/M

Context Length

MCP

Mcp Server For Document Processing

该项目是一个基于Model Context Protocol (MCP)标准的文档处理服务器，通过构建向量数据库和MCP接口，使AI助手能够访问外部文档资源，突破大语言模型的知识限制。项目包含文档处理流水线和MCP服务端两大组件，支持多种嵌入模型和文件格式，可应用于最新技术文档查询、私有代码库理解等场景。

python

9.2k

2.5points

Unity MCP

Unity-MCP是一个连接大型语言模型(LLM)与Unity编辑器的桥梁工具，通过暴露Unity编辑器功能给AI客户端，实现AI驱动的自动化开发流程。它支持自定义工具扩展，目前提供游戏对象管理、场景操作、资产处理等核心功能，主要适用于Unity编辑器环境。

csharp

12.9k

2.5points

Reavorse Mcp

Unity MCP Package是一个专注于增强材质编辑的Unity插件，基于MCP协议实现Unity与大型语言模型的双向通信，支持资产管理、场景控制、脚本集成等功能，并计划添加更多高级特性。

csharp

10.2k

2.5points

DINO X MCP

DINO-X MCP是一个通过DINO-X和Grounding DINO 1.6 API赋能大型语言模型进行细粒度目标检测和图像理解的项目。它能够实现精确的对象定位、计数、属性分析以及场景理解，支持自然语言驱动的视觉任务和工作流集成。

typescript

2.5points

Dino X Mcp

DINO-X MCP是一个结合大型语言模型与DINO-X、Grounding DINO 1.6 API的项目，旨在实现细粒度物体检测和图像理解，支持自然语言驱动的视觉任务和自动化场景。

typescript

8.2k

2.5points

Auto Causal Inference

Auto Causal Inference是一个利用大型语言模型(LLM)自动进行因果推断的项目，用户只需指定处理变量和结果变量，系统就能自动完成变量角色识别、因果图构建、效应估计和模型验证等全流程分析。项目提供两种代理架构(LangGraph和MCP)来实现这一功能，特别适用于银行场景下的因果问题分析。

python

7.3k

2.5points