企业对生成式AI投资低至1%,MenloVentures报告揭示行业趋势

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Meta与伯克利分校联合开发StreamDiT模型,实现AI视频实时生成突破:1)单GPU支持16帧/秒512p视频流生成,40亿参数模型可即时创作1分钟视频并实时编辑;2)创新移动缓冲区架构实现并行帧处理,半秒生成两帧,8步计算优化保持画质;3)训练采用3000高质量视频+260万数据集,局部信息交互设计提升效率;4)性能测试中动作流畅度等指标全面领先现有技术,300亿参数版本展现质量提升潜力;5)当前存在片段过渡不自然等局限,但为实时交互视频创作开辟新可能。
Meta收购AI语音初创公司Play AI,后者团队将加入Meta。此次收购旨在强化Meta在语音合成领域的技术实力,与其AI角色、可穿戴设备等业务形成协同。Meta近年来持续加码AI布局,包括从OpenAI挖角人才、与Scale AI合作等。此次收购虽未披露金额,但显示Meta欲在AI语音领域保持领先优势。随着智能设备普及,AI语音技术需求增长,Meta此举将提升其语音交互体验和市场竞争力。
Meta收购AI语音初创公司Play AI,以增强其在AI角色、可穿戴设备等领域的语音技术能力。Play AI团队将整体加入Meta,其自然语音生成技术与Meta多个AI项目高度契合。这是Meta在AI领域的又一重要布局,此前已从OpenAI挖角人才并与Scale AI达成合作。交易金额未披露。
【140字概括】一起十年遗产纠纷案中,ChatGPT帮助受害者Rejeana揭露500万美元欺诈。其父去世后,自称妻子的Irma独占遗产,后被查出重婚。案件涉及律师与管理人勾结隐瞒资产。无力支付律师费的Rejeana用AI梳理500份文件,起草91页动议,最终推动案件重启听证会。该案例展现AI法律辅助潜力,也凸显人工核查的必要性。
特斯拉推出Grok AI助手,仅限搭载AMD锐龙处理器的车型使用。用户需在设置中确认硬件配置,2025.26版本软件更新后可用。目前Grok主打交互功能,暂不支持车辆控制。AMD锐龙平台因强大计算性能被选中,特斯拉2021年起逐步采用该平台。未来Grok功能将随技术发展持续扩展,旧款英特尔处理器车型无法兼容。
特斯拉推出AI助手Grok,仅支持搭载AMD锐龙处理器的车型,通过2025.26软件更新启用。该助手目前仅提供智能交互功能,暂不支持车辆控制。特斯拉自2021年起逐步从英特尔转向AMD Zen3架构处理器,以提升系统性能支持AI运行。老款英特尔车型因性能限制无法使用该功能。Grok除实用功能外,还将提供幽默互动体验。
SpaceX宣布向子公司xAI投资20亿美元,助力其追赶OpenAI。xAI估值达1130亿美元,其AI产品Grok已应用于星链客服,未来将整合至特斯拉Optimus机器人。尽管Grok曾因不当回应引发争议,公司已修复问题。xAI最新推出Grok4大模型,计算能力较前代提升100倍,依托全球最大超级计算机(10万块H100GPU)。马斯克称Grok为"最聪明AI",xAI有望推动新技术突破。
马蜂窝推出"AI路书"等智能旅行工具,全面升级出境自由行体验。"AI路书"采用"主动提问-需求校准-精准生成"模式,基于海量数据生成个性化行程方案。同时上线三大实用功能:AI代订日本餐厅、多语种实时翻译和菜单拍照识图,解决境外沟通难题。AI旅行助手"AI小蚂"支持7种语言实时翻译,还能通过截图自动完成餐厅预订。这些创新功能覆盖从行程规划到目的地服务的全链路,大幅提升旅行便利性。
【AI日报速览】1.智谱推出免费AI Slides,基于GLM模型快速生成专业PPT;2.可灵AI发布可图2.1,图像生成支持180种风格;3.NVIDIA推出DiffusionRenderer,实现视频转3D场景编辑;4.墨刀AI上线30秒生成可编辑原型功能;5.Higgsfield Soul ID用10张照片生成虚拟形象;6.谷歌开源GenAI Processors构建AI工作流;7.谷歌Veo3新增图转视频功能;8.Mistral AI发布专注代码生成的Devstral2507系列模型。
谷歌DeepMind开源Python库"GenAI Processors",助力开发者构建高效生成式AI工作流。该库支持多模态数据异步处理,优化Gemini API应用开发,显著降低实时应用延迟。核心功能包括模块化Processor接口、流式API设计及并发优化,可快速构建智能助手等实时应用。目前仅支持Python,但开放社区贡献,未来计划扩展功能覆盖更多场景。这一开源工具将加速生成式AI生态发展,特别适合低延迟的多模态交互应用开发。