谷歌Gemini Live语音功能实现五大突破:实时语速调节、情绪化语气、个性口音切换、无障碍优化及多模态整合,推动AI语音进入“拟人化2.0”时代。其超越基础对话能力,模拟人类呼吸节奏,精准打击ChatGPT语音模式,标志着AI从“能听会说”迈向“懂你所想”新阶段。(140字)
Google Play 将为移动游戏引入Gemini AI助手,通过侧边栏直接集成Gemini Live功能,玩家无需切换窗口即可获取游戏提示。该助手具备视觉识别能力,可实时分析游戏画面,提供精准建议,提升游戏体验的便捷性和互动性。
谷歌在"谷歌制造"活动上发布Pixel10系列手机,搭载全新Tensor G5处理器,支持Gemini Nano模型,AI功能全面升级,新增Gemini Live语音和图像生成工具,比苹果iPhone17提前发布,强化AI智能手机布局。
谷歌推出Gemini Live新功能,通过屏幕高亮和实时对话提升AI助手互动体验。用户可用手机摄像头扫描物品,AI将高亮显示相关对象,帮助快速定位所需工具,增强日常便利性。
一个集成了Gemini多模态直播和WebRTC技术的单文件应用
AI驱动的移动对话体验
Openai
$2.8
输入tokens/百万
$11.2
输出tokens/百万
1k
上下文长度
Google
$0.49
$2.1
$7.7
$30.8
200
$0.7
$17.5
Alibaba
$8
$240
52
$0.4
-
128
$1.75
$14
400
Iflytek
$2
8
$8.75
$70
Tencent
$1
$3
4
Bytedance
$1.5
$4.5
$0.3
$0.6
32
$56
$1.4
131