Best 语音对语音对话模型 AI Tools & Models - Premium 语音对语音对话模型 News

AI News

阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！

阶跃星辰发布新一代实时语音大模型StepAudio 2.5 Realtime，已全面上线并开放给开发者。该模型通过提升副语言感知、人设自定义和对话能力，提供更真实的对话体验。核心创新在于处理语调、语速、停顿及叹息等非文字信息，增强交互自然度。

17.9k 2 hours ago

阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！

阶跃星辰发布StepAudio 2.5 Realtime：赋予大模型真人般的情感与智慧

阶跃星辰发布新一代实时语音大模型StepAudio 2.5 Realtime，标志着大模型交互从“文本对话”迈向“实时情感交流”的质变。该模型显著提升了语音交互的自然度与智能化程度，实现“真人级”深度感知体验，推动国产大模型在语音领域迈上新台阶。

13.4k 1 days ago

马斯克旗下 Grok 接入 CarPlay，车内 AI 对话再添强援

苹果CarPlay生态迎来新成员，马斯克旗下xAI（现SpaceXAI）更新iOS版Grok应用，正式支持CarPlay框架。iPhone用户现可通过车载中控屏与Grok模型进行自然语言交互。得益于iOS 26.4版本放宽语音对话应用限制，Grok得以入驻，标志着AI驾驶辅助体验进一步扩展。

12.5k 3 hours ago

AI日报：OpenAI发布三款实时语音模型；苹果首款AI硬件曝光；美团入局AI社交赛道

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、OpenAI发布三款实时语音模型，针对推理对话、实时翻译和实时转录OpenAI推出了三款新型实时语音模型，旨在为开发者提供更先进的语音应用解决方案。8、OpenAI发布CodexChrome扩展程序深度集成浏览器环境OpenAI推出CodexforChrome浏览器扩展，旨在优化浏览器内的工作流，提升网页任务处理效率，并推动Codex应用生态的增长。

31.1k 8 minutes ago

AI日报：OpenAI发布三款实时语音模型；苹果首款AI硬件曝光；美团入局AI社交赛道

AI Products

MOSS-TTSD

一款支持中英文的对话语音合成模型。

文本转声音

12.1k

Unmute

使用低延迟语音识别和合成模型与 AI 对话。

语音识别

12k

Sesame CSM

一个用于生成对话式语音的模型，支持从文本和音频输入生成高质量的语音。

语音合成

12.7k

百聆

百聆是一个类似GPT-4o的语音对话机器人，通过ASR+LLM+TTS实现，低配置也可运行，支持打断。

聊天机器人

11.8k

Models

GPT-4.1 mini

Openai

$2.8

Input tokens/M

$11.2

Output tokens/M

Context Length

Gemini 2.0 Flash-Lite

Google

$0.49

Input tokens/M

$2.1

Output tokens/M

Context Length

Grok 4 Fast

Xai

$1.4

Input tokens/M

$3.5

Output tokens/M

Context Length

o3-mini

Openai

$7.7

Input tokens/M

$30.8

Output tokens/M

200

Context Length

GPT-5 Codex

Openai

Input tokens/M

Output tokens/M

Context Length

Claude 3 Opus

Anthropic

$105

Input tokens/M

$525

Output tokens/M

200

Context Length

Gemini 2.0 Flash

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

Claude Haiku 4.5

Anthropic

Input tokens/M

$35

Output tokens/M

200

Context Length

Gemini 2.5 Flash

Google

$2.1

Input tokens/M

$17.5

Output tokens/M

Context Length

Claude Sonnet 4.5

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Claude 3 Sonnet

Anthropic

$21

Input tokens/M

$105

Output tokens/M

200

Context Length

Gemini 2.5 Flash-Lite

Google

$0.7

Input tokens/M

$2.8

Output tokens/M

Context Length

qwen3-coder-plus

Alibaba

Input tokens/M

$16

Output tokens/M

Context Length

qwen3-vl-plus

Alibaba

Input tokens/M

$10

Output tokens/M

256

Context Length

qwen3-vl-235b-a22b-thinking

Alibaba

Input tokens/M

$20

Output tokens/M

Context Length

Qianfan-Lightning

Baidu

Input tokens/M

Output tokens/M

128

Context Length

qwen3-max

Alibaba

Input tokens/M

$24

Output tokens/M

256

Context Length

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

Doubao-Seed-Translation

Bytedance

$1.2

Input tokens/M

$3.6

Output tokens/M

Context Length

Qwen3-Next-80B-A3B-Instruct

Alibaba

Input tokens/M

Output tokens/M

256

Context Length

MCP

1lc

基于大模型的智能对话机器人项目，支持多平台接入和多种AI模型，具备文本、语音、图像处理及插件扩展能力，可定制企业AI应用。

python

8.7k

2.0points

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

阶跃星辰推出 StepAudio 2.5 Realtime，实时语音 AI 再升级！

阶跃星辰发布StepAudio 2.5 Realtime：赋予大模型真人般的情感与智慧

马斯克旗下 Grok 接入 CarPlay，车内 AI 对话再添强援

AI日报：OpenAI发布三款实时语音模型；苹果首款AI硬件曝光；美团入局AI社交赛道

AI Products

MOSS-TTSD

Unmute

Sesame CSM

百聆

Models

GPT-4.1 mini

Gemini 2.0 Flash-Lite

Grok 4 Fast

o3-mini

GPT-5 Codex

Claude 3 Opus

Gemini 2.0 Flash

Claude Haiku 4.5

Gemini 2.5 Flash

Claude Sonnet 4.5

Claude 3 Sonnet

Gemini 2.5 Flash-Lite

qwen3-coder-plus

qwen3-vl-plus

qwen3-vl-235b-a22b-thinking

Qianfan-Lightning

qwen3-max

qwen3-livetranslate-flaltimeash-re-2025-09-22

Doubao-Seed-Translation

Qwen3-Next-80B-A3B-Instruct

Dia2 2B

Dia2 1B

MOSS TTSD V0.7

Kani Tts 400m Es

Kani Tts 400m Ar

Kani Tts 400m En

Kani Tts 400m 0.3 Pt

Kani Tts 370m

Kani Tts 450m 0.2 Pt

Step Audio 2 Mini

Marvis Tts 250m V0.1 Transformers

MOSS TTSD V0.5

Csm 1b

Quantized Dia 1.6B Int8

Dia 1.6B

Csm 1b Safetensors Fp16

Tts V1 Finetuned

Dia 1.6B Safetensors Fp16

Dia 1.6B

Csm Expressiva 1b

MCP

1lc