据Windows Central报道,Microsoft PowerPoint网页版现已支持在演示文稿中嵌入带隐藏式字幕和字幕的视频。这一新功能不仅使听障人士更容易访问演示文稿,还允许用户添加多种语言的字幕以覆盖全球观众,并使每个人在嘈杂或安静的环境中更轻松地观看视频。此举反映了微软加强产品和服务可访问性的持续努力。
据Windows Central报道,Microsoft PowerPoint网页版现已支持在演示文稿中嵌入带隐藏式字幕和字幕的视频。这一新功能不仅使听障人士更容易访问演示文稿,还允许用户添加多种语言的字幕以覆盖全球观众,并使每个人在嘈杂或安静的环境中更轻松地观看视频。此举反映了微软加强产品和服务可访问性的持续努力。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
数字头像生成公司Lemon Slice获1050万美元种子融资,投资方包括Matrix Partners、Y Combinator及The Chainsmokers等。公司致力于为AI聊天机器人添加视频功能,其最新扩散模型Lemon Slice-2仅需一张图片即可生成动态数字头像。该模型拥有200亿参数,可在单个GPU上实现每秒20帧的直播视频,并通过API和可嵌入小工具提供服务。
豆包视频生成模型Seedance1.5Pro正式上线火山方舟,提升AI视频创作效率与质量。该模型支持音画同步输出、多语言多人对白配音,并具备突出的影视级叙事张力。企业用户可通过火山方舟获取API服务,个人用户也可使用。

生数科技与清华TSAIL实验室联合开源TurboDiffusion视频生成加速框架,实现最高200倍推理加速,且几乎不影响生成质量,突破视频生成关键瓶颈。

OpenAI推出类似Spotify Wrapped的年度回顾功能,为用户提供个性化使用报告,并根据对话习惯授予特定称号。

谷歌DeepMind推出Gemma Scope2,这是一个开放的可解释性工具套件,旨在深入分析Gemma3语言模型从2.7亿到270亿参数的各层次信息处理。该工具帮助AI安全与对齐团队追踪模型内部特征,以应对“越狱”、幻觉或不当行为等问题。

Perplexity推出“2025年回顾”工具,通过预设提示帮助用户总结年度活动,但被指内容较简单。OpenAI也推出“你的ChatGPT年度总结”功能,提供个性化年度回顾。

OpenAI推出ChatGPT“年度回顾”功能,为用户生成个性化AI交互档案。报告统计消息总数、分析聊天习惯,并根据高频主题生成像素风格定制图像。
OpenAI为ChatGPT新增“热情度”调节功能,用户可在个性化设置中选择“更多”“更少”或“默认”三档,精细控制AI的温暖程度、兴奋感及表情符号使用频率。这标志着AI交互从预设人格迈向更细致的情绪微调阶段。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、阿里通义千问Qwen发布分层图像编辑模型Qwen-Image-Layered,一键生成“Photoshop图层”阿里通义千问Qwen发布了分层图像编辑模型Qwen-Image-Layered,该模型能够将静态照片分解为多个具有透明背景的独立RGBA图层,使AI图像编辑具备类似Photoshop的结构化操作能力。文章介绍了PromptFill这一开源结构化提示词生成工具,通过填空式交互降低AI绘画的门槛,解决复杂Prompt编写难题,并强调其在提升创作效率和隐私保护方面的优势。
Meta智能眼镜升级,新增“对话聚焦”助听功能,利用定向麦克风在嘈杂环境中清晰捕捉对话者声音,并与Spotify深度集成,提升交互体验。