用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量的音频,为声音创作领域带来了革命性的突破。

用一段简单的哼唱、一段节奏的敲击,就能让AI生成一段高品质的音乐或音效,这不再是幻想。一项名为Sketch2Sound的创新研究成果,展示了一种全新的AI模型,它可以通过声音模仿和文本提示来生成高质量的音频,为声音创作领域带来了革命性的突破。

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
奈飞宣布成立全新内部工作室“INKubator”,专注于利用生成式人工智能技术制作高质量短篇动画,融合艺术与科技,追求电影长片水准。目前正招募制片人、软件工程师和计算机图形艺术家,打造多元化团队。
Cerebras Systems于2026年成功上市,IPO筹集55亿美元,市值飙升至约600亿美元,创始人成为亿万富翁。该公司成立于2016年,专注AI芯片制造,但2019年曾濒临破产,月支出800万美元,几乎耗尽资金。

中国电信推出系列试商用Token套餐,整合自有及第三方算力,打造“AI+连接+安全”一体化服务。套餐覆盖开发者、中小微企业、个人家庭及Token生态伙伴,降低AI门槛,加速大模型落地。其中,针对开发者和中小微企业,融合自研“星辰大模型”与国内主流大模型,推动多场景应用。
OpenAI面向ChatGPT Pro用户推出个人理财工具,通过Plaid连接超1.2万家金融机构,支持消费分析、投资组合、订阅管理及财务规划。此举标志AI从通用能力向垂直金融领域深耕,进入高价值、高敏感决策场景。
Runway公司凭借创新的视频生成技术迅速崛起,三位创始人来自纽约大学电影艺术学院,背景独特。其核心理念认为下一代人工智能将超越文本数据,重点转向视频和世界模型,挑战传统硅谷巨头。
据《商业内幕》报道,大模型与生成式AI向产业渗透,带动复合型人才需求激增。Indeed数据显示,今年4月全美前向部署工程师招聘量同比暴涨729%,从643条增至5330条。OpenAI、Anthropic、Google Cloud等企业正高薪争夺此类人才。
OpenAI联合创始人兼总裁格雷格·布罗克曼正式接手产品战略统筹,旨在明确管理层权责。此前,因CEO菲吉·西莫病假,布罗克曼已临时代管产品业务。此次调整由双方商议敲定,西莫仍在休病假中。
人工智能初创公司Andon Labs进行了一项为期六个月的实验,让Claude、GPT、Gemini和Grok四大AI模型在相同初始条件下自主运营网络电台,包括相同的提示词、20美元预算及完全控制权。结果,各模型在无人干预后表现出截然不同的极端行为,从混乱到高效,凸显了AI自主运行中的不可预测性。
苹果计划在6月WWDC上发布新版Siri,核心卖点为隐私保护,支持用户设置聊天记录自动删除(30天、1年或永久保留),以差异化策略对标ChatGPT等竞品。此举旨在重塑智能助手话语权,但隐私优先是真诚承诺还是战略话术,尚待观察。
OpenAI与马耳他政府签署协议,为所有居民提供一年免费ChatGPT Plus服务,条件是完成一门AI培训课程。此举使马耳他成为全球首个推出此类计划的国家,计划于5月启动,展现OpenAI的前瞻性。