Best 语音驱动 AI Tools & Models - Premium 语音驱动 News

AI News

丢掉键盘：Genspark 发布 Workspace 2.0，开启语音办公新纪元

Genspark推出AI Workspace2.0，核心转向语音驱动，旨在重塑知识工作者办公模式。其灵魂产品Speakly作为独立工具，支持macOS和Windows，用户通过自然语音即可实现复杂自动化流程。

巨人网络首创大模型原生玩法，游戏“假人”变身智商天花板

巨人网络旗下游戏《超自然行动组》推出国内首个深度融合AI大模型的“AI大模型挑战”玩法。该玩法将传统NPC升级为由AI大模型实时驱动的智能对手，能语音交流、模仿真人玩家行为，并潜伏队伍中伺机行动。这标志着AI原生玩法在大DAU级游戏中实现规模化落地。

8.7k 13 hours ago

苹果豪掷10亿美元牵手谷歌！新Siri明年春季上线，Gemini大模型驱动语音助手重生

苹果与谷歌达成合作，每年支付约10亿美元获得Gemini大模型使用权，计划2026年春季随iOS26.4推出升级版Siri。此举旨在弥补苹果自研大模型不足，重夺智能语音主导权。新Siri将基于1.2万亿参数的Gemini2.5Pro，性能远超当前版本。

8.8k 8 hours ago

盲人也能“看见”街景？Google新AI系统让虚拟探索无障碍，科技向善迈出关键一步

谷歌推出StreetReaderAI原型系统，帮助盲人和低视力用户通过自然语言交互自主探索谷歌街景。该系统融合计算机视觉、地理信息系统和大语言模型，实现多模态AI驱动的实时对话式街景体验，突破传统语音播报局限，提升无障碍城市探索自由度。

13.5k 3 days ago

盲人也能“看见”街景？Google新AI系统让虚拟探索无障碍，科技向善迈出关键一步

AI Products

ShareSpeak

AI驱动的隐形提词器，适用于Mac和Windows，语音控制，提升演示效果

效率工具

5.5k

Echosnap Ai

AI驱动的语音笔记应用，可即时记录、转录和整理想法

语音转文本

7.3k

OpenWispr

将您的语音立即转换为文本。完全私密，开源，由AI技术驱动。

语音转文本

6.1k

VideoTutor

VideoTutor是一款AI驱动的工具，根据用户提出的问题生成动画、语音引导的学习视频。

学习教育

14.6k

Models

qwen3-livetranslate-flaltimeash-re-2025-09-22

Alibaba

Input tokens/M

$240

Output tokens/M

Context Length

wan2.5-i2v-preview

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-omni-flash-realtime

Alibaba

$3.9

Input tokens/M

$15.2

Output tokens/M

Context Length

qwen3-omni-30b-a3b-captioner

Alibaba

$15.8

Input tokens/M

$12.7

Output tokens/M

Context Length

qwen3-tts-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

qwen3-tts-flash-realtime

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-pro-32k

Bytedance

$0.8

Input tokens/M

Output tokens/M

128

Context Length

qwen3-asr-flash

Alibaba

Input tokens/M

Output tokens/M

Context Length

Doubao-1.5-UI-TARS

Bytedance

$3.5

Input tokens/M

$12

Output tokens/M

128

Context Length

Hunyuan-TurboS-latest

Tencent

$0.8

Input tokens/M

Output tokens/M

Context Length

qwen-tts-realtime

Alibaba

$2.4

Input tokens/M

$12

Output tokens/M

Context Length

Doubao-1.5-thinking-vision-pro

Bytedance

Input tokens/M

Output tokens/M

128

Context Length

qwen-tts

Alibaba

$1.6

Input tokens/M

$10

Output tokens/M

Context Length

o3

Openai

$14

Input tokens/M

$56

Output tokens/M

200

Context Length

qwen-omni-turbo

Alibaba

$1.5

Input tokens/M

$1.6

Output tokens/M

Context Length

Grok-3

Xai

$21

Input tokens/M

$105

Output tokens/M

128

Context Length

GPT-3.5 Turbo

Openai

$3.5

Input tokens/M

$10.5

Output tokens/M

Context Length

百度蒸汽机2.0

Baidu

Input tokens/M

Output tokens/M

Context Length

Gemma 2 9B

Google

Input tokens/M

Output tokens/M

Context Length

Empowering the future, your artificial intelligence solution think tank

English 简体中文繁體中文にほんご

FirendLinks:

AI Newsletters AI Tools MCP Servers AI News AIBase LLM Leaderboard AI Ranking

Business Cooperation Site Map

AI News

丢掉键盘：Genspark 发布 Workspace 2.0，开启语音办公新纪元

巨人网络首创大模型原生玩法，游戏“假人”变身智商天花板

苹果豪掷10亿美元牵手谷歌！新Siri明年春季上线，Gemini大模型驱动语音助手重生

盲人也能“看见”街景？Google新AI系统让虚拟探索无障碍，科技向善迈出关键一步

AI Products

ShareSpeak

Echosnap Ai

OpenWispr

VideoTutor

Models

qwen3-livetranslate-flaltimeash-re-2025-09-22

wan2.5-i2v-preview

qwen3-omni-flash-realtime

qwen3-omni-30b-a3b-captioner

qwen3-tts-flash

qwen3-tts-flash-realtime

Doubao-1.5-pro-32k

qwen3-asr-flash

Doubao-1.5-UI-TARS

Hunyuan-TurboS-latest

qwen-tts-realtime

Doubao-1.5-thinking-vision-pro

qwen-tts

o3

qwen-omni-turbo

Grok-3

GPT-3.5 Turbo

百度蒸汽机2.0

Gemma 2 9B

JoyHallo V1

Whisper Large Onnx Int4 Inc