近期,OpenAI的热门工具Sora取消了静音模式。ElevenLabs作为AI创投公司推出了新的模型,能为视频内容添加背景声音,实现更逼真的效果。这一新技术使得用户可以通过描述来生成声音,为内容添加声效,展现出明显的先发优势。随着AI音效技术的不断进步,生成式AI逐渐实现了通过单一提示创建完整内容的梦想。
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近期,OpenAI的热门工具Sora取消了静音模式。ElevenLabs作为AI创投公司推出了新的模型,能为视频内容添加背景声音,实现更逼真的效果。这一新技术使得用户可以通过描述来生成声音,为内容添加声效,展现出明显的先发优势。随着AI音效技术的不断进步,生成式AI逐渐实现了通过单一提示创建完整内容的梦想。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
Instacart CEO Fidji Simo将于8月18日加入OpenAI担任新设立的"应用首席执行官",直接向Sam Altman汇报,负责领导公司三分之一团队,将AI技术转化为实际应用。该职位是Altman5月重组计划的一部分,旨在让其专注研发,而Simo专注产品增长。她将整合现有业务团队,推动AI在医疗、教育、创意等领域的应用落地。Simo强调AI发展面临关键抉择:是普惠大众还是加剧权力集中。此次任命正值OpenAI管理层调整期,Simo此前已担任董事。
AI巨头OpenAI与谷歌DeepMind就IMO金牌成绩爆发激烈竞争。两家公司均宣布其AI模型在2025年国际数学奥林匹克竞赛中正确解答5/6题目,超越多数人类选手。此次突破显示AI在模糊推理领域的进步,但引发"谁先宣布"的争议:OpenAI周六抢先公布,遭谷歌批评未遵循官方流程。谷歌称其成绩获IMO官方认可,而OpenAI则聘请前IMO奖牌得主评估。这场争论折射出AI领域白热化竞争态势,随着GPT-5即将发布,行业领先地位争夺战愈演愈烈。
美国"星际之门"AI项目进展受阻:原计划5000亿美元投资面临缩减,软银与OpenAI在数据中心选址等关键条款上存在分歧。项目启动6个月仍未完成任何数据中心交易,目前仅计划年底前在俄亥俄州建成小型数据中心。孙正义仍保持对OpenAI的投资信心,但奥尔特曼已另寻合作伙伴,与甲骨文达成300亿美元数据中心协议。该项目进展远低于预期,凸显AI基础设施建设面临的挑战。
OpenAI宣布2025年前部署超100万个GPU,启动"百倍扩容"计划。同时披露5000亿美元的Stargate项目,将在得州建设全球最大AI训练集群。该项目由软银CEO孙正义担任董事长,OpenAI负责运营,获微软、英伟达等科技巨头支持,旨在强化AI基础设施布局,提升技术竞争力。
OpenAI宣布GPT-5即将发布,但澄清其并非在国际数学奥赛夺金的实验性模型。CEO表示获奖模型采用了新技术,数学能力远超现有水平,而GPT-5虽会带来惊喜体验,但数学能力将有所不同。社区热议GitHub上出现的疑似GPT-5测试模型,OpenAI强调需区分不同模型的实际能力,为市场预期提供明确指引。AI领域持续关注GPT-5发布及技术突破。(140字)
Meta成立"超级智能实验室"招募44名顶尖AI人才,其中50%来自中国,40%有OpenAI背景。扎克伯格将战略重心从元宇宙转向AI,不惜重金挖角,曾开出2亿美元签约奖金招募苹果高管。新团队75%拥有博士学位,70%为研究人员,人才结构多元。Meta此举展现其在AI领域的雄心,也加剧了行业人才争夺战。
OpenAI宣布2025年前部署超100万块GPU的"百倍扩容"计划,核心包括:1)投资5000亿美元的Stargate项目,在得州建设全球最大AI训练集群;2)重构芯片供应链;3)解决能源挑战。该项目由软银CEO孙正义任董事长,与甲骨文、Arm、微软等巨头合作。这一战略布局将重塑AI基础设施格局,推动行业进入高速发展新阶段,预计对市场产生重大影响。
【AI日报速览】今日AI领域迎来多项突破:1)月之暗面Kimi开放平台上线Playground,实现AI从对话助手到智能助理的升级;2)OpenAI发布能自主执行任务的ChatGPT Agent;3)Suno v4.5+推出人声替换等创新音乐功能;4)谷歌Veo3视频生成模型开放API但成本较高;5)首个实时视频转换AI模型MirageLSD问世;6)VSCode编程助手Traycer提升大型代码库处理效率;7)ART框架简化AI Agent训练;8)NVIDIA语音识别模型创5.63%错误率新低;9)Mistral AI推出对标ChatGPT的Le Chat;10)百度小度发布支持物理交互的MCP Server;11)Lightricks突破60秒AI视频生成;12)开源视频模型LTX-Video 13B实现30倍速高清生成。
AI搜索公司Perplexity正通过印度市场实现弯道超车,与巴提电信达成独家合作,向3.6亿用户提供1年免费Pro服务。该公司在印度下载量同比增长600%,月活用户增长640%,并已与Paytm等本土巨头合作。虽然用户增速远超ChatGPT,但商业化变现仍是挑战。Perplexity正通过电信合作+本土化策略,抢占全球最大互联网市场之一的AI高地。
OpenAI顾问委员会发布报告,主张人工智能技术应由非营利组织监管以确保民主参与。该委员会建议OpenAI转型为公益公司,平衡股东利益与社会使命,并呼吁增加对公共利益的投入,包括建立快速响应基金支持艺术、医疗等领域。报告强调AI发展应听取受影响社区意见,促进技术普惠共享。OpenAI自2015年成立以来经历多次结构调整,当前正面临治理挑战。