Best 端到端架构 AI Tools & Models - Premium 端到端架构 News

AI News

超低延迟 AI 对话神器！Wan-Streamer v0.2 让你与 AI 零距离沟通

通义实验室推出Wan-Streamer v0.2，彻底解决传统视频通话卡顿、延迟和声画不同步问题。该端到端全模态模型仅550毫秒响应，将听、看、说、演能力整合于单一Transformer架构，实现近乎真实的“面对面”自然交流。

16.6k 1 days ago

超低延迟 AI 对话神器！Wan-Streamer v0.2 让你与 AI 零距离沟通

MiniMax发布Code2.0桌面端:底层架构全面重构，原生接入金融多源数据

MiniMax发布Code2.0桌面端，基于Pi Agent重构底层架构，优化会话运行与工具调用链路，启动更快、长任务更稳。新增图表加载、缩放与下载优化，支持预览面板直接框选编辑保存文件，实现任务到交付的无缝闭环。

16.9k 1 days ago

两分钟上手生产级语音智能体：xAI 发布 Voice Agent Builder 测试版

xAI推出Voice Agent Builder测试版，通过零代码平台和自研Grok Voice模型，将企业级语音智能体搭建缩短至两分钟。其核心为高度集成的端到端架构，解决了传统方案语音转文字等多环节割裂的痛点，大幅降低了开发与运营门槛。

24.9k yesterday

智造短剧新引擎：火山引擎上线「火山剧创 1.0」，制作效率提升 80%

火山引擎推出“火山剧创1.0”，这是一站式AIGC短剧创作平台，适配自研大模型，基于多智能体架构和火山方舟算力底座，为专业团队提供全生命周期端到端解决方案。其核心功能覆盖短剧生产全链路，包括剧本创作等环节，旨在重构短剧工业化流程。

17.2k 35 minutes ago

Models

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Qwen3-0.6B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Wan2.1-I2V-14B-480P

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen3-4B

Alibaba

$0.3

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B Instructed

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E2B Instructed LiteRT (Preview)

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3n E4B Instructed

Google

$140

Input tokens/M

$280

Output tokens/M

Context Length

QianfanHuijin-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Qianfan-QI-VL

Baidu

Input tokens/M

Output tokens/M

Context Length

Hunyuan-Translation-Lite

Tencent

Input tokens/M

Output tokens/M

Context Length

Claude Opus 4

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Qianfan-Llama-VL-8B

Baidu

Input tokens/M

Output tokens/M

Context Length

Gemma 3 1B

Google

Input tokens/M

Output tokens/M

Context Length

Gemma 3 27B

Google

$0.7

Input tokens/M

$1.4

Output tokens/M

131

Context Length

Qwen_v2.5_3b_base

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_1.5b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Qwen_v2.5_3b_Instruct

Alibaba

Input tokens/M

Output tokens/M

Context Length

Gemini 1.0 Pro

Google

$3.5

Input tokens/M

$10.5

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AI Marketing LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

超低延迟 AI 对话神器！Wan-Streamer v0.2 让你与 AI 零距离沟通

MiniMax发布Code2.0桌面端:底层架构全面重构，原生接入金融多源数据

两分钟上手生产级语音智能体：xAI 发布 Voice Agent Builder 测试版

智造短剧新引擎：火山引擎上线「火山剧创 1.0」，制作效率提升 80%

Models

Claude 3 Sonnet

Qwen3-0.6B

Wan2.1-I2V-14B-480P

Qwen3-4B

Gemma 3n E2B Instructed

Gemma 3n E2B

Gemma 3n E2B Instructed LiteRT (Preview)

Gemma 3n E4B Instructed

QianfanHuijin-8B

Qianfan-QI-VL

Hunyuan-Translation-Lite

Claude Opus 4

Qianfan-Llama-VL-8B

Gemma 3 1B

Gemma 3 27B

Qwen_v2.5_3b_base

Qwen_v2.5_1.5b_Instruct

Qwen_v2.5_3b_Instruct

Gemini 1.0 Pro

HunyuanOCR

Asr Conformer Largescaleasr

Llama3.1 Typhoon2 Audio 8b Instruct

Diar_sortformer_4spk V1

MobileLLM 1.5B

Arabic Base Nougat

GOT_CPU

TexTeller

KinyarwandaTTS_female_voice

Rtdetr_r101vd_coco_o365

Sumen Base

Arabic Small Nougat

TexTeller

Tiny Mistral

Mms Tts Mah

Mms Tts Mos

Mms Tts Cat

Mms Tts Blh

Mms Tts Bgc

Mms Tts Kin