据Windows Central报道,Microsoft PowerPoint网页版现已支持在演示文稿中嵌入带隐藏式字幕和字幕的视频。这一新功能不仅使听障人士更容易访问演示文稿,还允许用户添加多种语言的字幕以覆盖全球观众,并使每个人在嘈杂或安静的环境中更轻松地观看视频。此举反映了微软加强产品和服务可访问性的持续努力。
据Windows Central报道,Microsoft PowerPoint网页版现已支持在演示文稿中嵌入带隐藏式字幕和字幕的视频。这一新功能不仅使听障人士更容易访问演示文稿,还允许用户添加多种语言的字幕以覆盖全球观众,并使每个人在嘈杂或安静的环境中更轻松地观看视频。此举反映了微软加强产品和服务可访问性的持续努力。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

腾讯AI应用“元宝”PC端新增“录音笔”功能,强化办公场景生产力。此次更新实现了移动端与桌面端的协同闭环,用户可直接在电脑上录音或上传音频文件,无需跨设备传输,提升了音频处理效率。

圣诞节当天,边缘AI初创公司Liquid AI发布开源模型LFM2-2.6B-Exp,仅26亿参数,却在多项基准测试中表现优异,指令跟随能力甚至超越数百亿参数的DeepSeek R1-0528,被赞为“最强3B级模型”。该模型基于第二代LFM2基础模型,通过纯强化学习实现实验性突破。

三星日历应用通过One UI 8.5更新引入AI功能,可根据日程标题自动生成匹配的视觉背景,提升交互体验。
OpenAI正开发名为“Skills”的新功能,代号“hazelnuts”,预计2026年1月上线。该功能强调模块化、可执行性与跨平台复用,旨在将AI能力从定制助手转向可复用的“能力模块”,有望革新用户与AI的协作方式。
阿里云通义实验室开源图像编辑模型Qwen-Image-Edit-2511,重点优化前代版本存在的编辑后图像“轻微漂移”问题,通过技术改进提升编辑一致性与视觉稳定性,为开发者提供更精准可靠的可控生成工具。

最新研究发现,通过短时间训练可显著提升识别AI合成人脸的能力。实验中,参与者对StyleGAN3生成的假脸进行辨别,未经训练时识别效果有限,但训练后准确率大幅提高。

清华大学TSAIL实验室与生数科技合作推出开源视频生成加速框架TurboDiffusion,通过集成SageAttention和稀疏线性注意力机制,显著降低高分辨率视频处理的计算开销,在保持生成质量的同时,将端到端扩散推理速度提升100至200倍。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、清华开源TurboDiffusion,AI视频生成速度暴增200倍,消费级显卡也能秒出大片!AI智能手机出货量预计以年均26%的速度增长AI聊天机器人平台的月活跃用户将冲击50亿大关。

X平台推出基于xAI Grok的在线图片AI编辑功能,用户可输入提示词便捷编辑图片,旨在提升创作体验。但该功能引发争议,创作者担忧原创内容可能被未经授权修改。

清华大学TSAIL实验室与生数科技联合开源视频生成加速框架TurboDiffusion,将AI视频扩散模型的推理速度提升100至200倍,视觉质量几乎无损。该技术针对现有开源模型进行深度优化,在单张RTX 5090显卡上实现从分钟级到秒级的实时生成,标志着AI视频创作进入新时代。