苹果AI/ML团队联手哥伦比亚大学成功突破谷歌人机验证码挑战

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,腾讯视频正式推出了首期 “AI 修复” 片单,涵盖电视剧、电影和少儿动画三大类别。这次更新的亮点在于对经典作品进行4K 超高清画质的修复,给 SVIP 用户带来了一场视觉盛宴。其中包括了家喻户晓的作品,如《家有儿女》、《食神》和《哪吒传奇》等,令不少影迷感慨 “回忆杀” 来袭。在播放页面,SVIP 用户只需轻松点击 “臻彩 MAX” 选项,就能一键开启 AI 修复画质。这项技术旨在解决老片常见的模糊问题,腾讯视频在此基础上进行了全面的升级,提升了画面的纯净度、流畅度
近日,香港推出了名为 “聆音” 的 EchoCare 超声大模型,这是全球首个训练规模超过400万张超声影像的数据集。该项目由中国科学院香港创新研究院的人工智能与机器人创新中心(CAIR)研发,旨在缓解超声医生紧缺的问题,并提高超声设备的使用效率和诊断水平。随着超声技术在疾病诊断和健康检测中日益重要,中国每年进行的超声检查量已达到20亿次,然而国内超声医生的缺口却高达15万。培养一名合格的超声医生需要3到5年,甚至某些领域的专家需要更长时间,这使得超声检查的普及面
近日,国际数据公司(IDC)发布了一份重磅报告,揭示了中国公有云大模型服务市场的最新动态。根据这份名为《中国大模型公有云服务市场分析,2025H1》的报告,预计到 2025 年上半年,中国公有云上大模型的调用量将达到惊人的 536.7 万亿个 Tokens。在这一市场中,火山引擎无疑是最大的赢家,以 49.2% 的市场份额雄踞第一。这一成就不仅展示了火山引擎在技术与服务上的优势,也彰显了其在公有云领域的强大竞争力。紧随其后的是阿里云和百度智能云,分别以 27% 和 17% 的市场份额位列第二
在科技行业,近期发生了一笔引人注目的交易,甲骨文(Oracle)宣布与 OpenAI 签署了一项价值3000亿美元的合作协议。这一消息一出,甲骨文的股价瞬间飙升,带动了整个 AI 概念股的集体上涨,市场一度热情高涨。然而,随着初期的乐观情绪渐渐消退,专家们对这一巨额交易的可持续性开始表达担忧。宾夕法尼亚大学的工程与计算机科学教授 Benjamin Lee 指出,这笔交易其实是一场 “高风险的赌博”。他警告称,大型科技公司在人工智能基础设施上的过度投资可能会带来不必要的风险,因为在
近日,阿里云正式宣布通义万相全新动作生成模型 Wan2.2-Animate 的开源,这一模型的推出将为短视频创作、舞蹈模板生成和动漫制作等领域带来极大便利。用户可以通过 GitHub、HuggingFace 和魔搭社区轻松下载模型及相关代码,此外,还可以利用阿里云的百炼平台调用 API,或在通义万相官网直接体验该模型的强大功能。Wan2.2-Animate 模型是在之前的 Animate Anyone 模型基础上进行全面升级的成果。在人物一致性和生成质量等方面都有了显著提升。该模型支持两种主要的应用模式:动作模仿和角色扮演
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、小米开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio小米公司宣布开源其首个原生端到端语音大模型 Xiaomi-MiMo-Audio,标志着语音技术领域的重大突破。该模型基于创新的预训练架构和上亿小时的训练数据,在少样本泛化能力方面表现出色,并在多个评测基准中超越了其他闭源模型。【AiBase提
近日,多模态 AI 领域的先锋企业生数科技宣布成功完成数亿元人民币的 A 轮融资。这轮融资由博华资本领投,老股东百度战投、北京市人工智能产业投资基金等多个投资方继续跟进,显示出市场对生数科技的高度认可。公司计划利用这笔资金进一步推动模型研发和技术创新,探索多模态大模型的潜力,进而加速产品拓展和用户服务。多模态技术,尤其是视频生成领域,正处于快速发展的阶段。生数科技的融资负责人表示,预计在未来三年内,多模态生成将改变全球数字内容的生产方式,逐
谷歌近日宣布,Chrome 浏览器将迎来有史以来最大的一次升级,主要是通过加入 AI 功能来提升用户体验。这项更新将于今日在美国的 macOS 和 Windows 用户中推送,使用英语设置的用户将率先体验到这些新功能。谷歌产品副总 Mike Torres 表示,此次升级的核心是 “Gemini 化”,用户可以通过新增加的 Gemini 按钮,获得网页的 AI 简化解释,快速总结多个标签的信息,回顾网页历史以及使用谷歌应用中的内容。此外,Chrome 还将提供一些 AI 浏览器常见的功能。除了这些功能,谷歌还计划对地址栏(omn
Suno近日通过神秘预告视频引发全球热议:其第五代音乐模型“v5”即将推出。这一声明被业内视为AI音乐创作的“变革性”里程碑,预计将进一步模糊人类作曲与机器生成的界限,推动从业余爱好者到专业制作人的创作门槛大幅降低。Suno官方于9月18日晚间在社交平台发布一段15秒短视频,画面中闪烁着抽象的音符与光影交织,配以低沉的电子旋律,结尾定格在“coming soon...”的字样。该视频迅速积累超过10万次浏览,并在数小时内引发数千条讨论。视频虽未透露具体发布时间,但从Suno以往迭
2025年9月19日,阿里云宣布通义万相全新动作生成模型 Wan2.2-Animate 正式开源。该模型能够驱动人物、动漫形象和动物照片,广泛应用于短视频创作、舞蹈模板生成、动漫制作等领域。用户可以在 GitHub、HuggingFace 和魔搭社区下载模型和代码,也可以通过阿里云百炼平台调用 API 或在通义万相官网直接体验。 Wan2.2-Animate 模型是基于此前开源的 Animate Anyone 模型全面升级的成果,在人物一致性、生成质量等指标上大幅提升,同时支持动作模仿和角色扮演两种模式。在角色模仿模式下,输入一张角色图片和一段参考视频,模型可以将视频角色的动作和表情迁移到图片角色中,赋