9月25日,OpenAI为旗下热门对话AI ChatGPT推出了语音交互和图片识别等多模态功能。新功能支持用户通过语音对话以及上传图片进行交互,可实现语音识别、文本识别、物体检测等功能。多模态版ChatGPT称为GPT-4V,与GPT-4同期训练完成,考虑到安全性才推迟发布。OpenAI表示新功能会先在ChatGPT Plus订阅用户和企业版用户中推出。
相关AI新闻推荐
最新版国内直连Sora2,无水印免费使用教程
OpenAI发布Sora2,五天下载量破百万,登顶App Store免费榜,增速超越GPT。相比前代,文字理解能力显著提升,能根据简单提示词自动生成音画同步的完整视频,无需手动配音配乐,适用于短视频、广告、短剧、MV及动画制作。

马来西亚迎来 AI 新纪元,ChatGPT Go 助力数字化转型
OpenAI在马来西亚推出ChatGPT Go订阅服务,月费约9.25美元,大幅降低AI使用门槛。服务包含GPT-5模型及图片生成、文件上传、记忆等丰富功能,提升用户体验。此举旨在吸引当地快速增长的中端用户和学生群体。

OpenAI 与微软达成重磅交易:股权结构再变,投资者面临稀释风险
OpenAI近期交易使其股权结构复杂化,投资者对回报存疑。公司估值达5000亿美元,成为全球最有价值非上市公司,主要受益于与英伟达和AMD的数十亿美元芯片合同,资金将用于实现万亿级算力部署目标。

OpenAI联手阿根廷,投资250亿美元打造超级数据中心
OpenAI计划在阿根廷投资250亿美元建设大型数据中心,具备500兆瓦AI计算能力,将成为该国最大信息技术项目之一,推动科技发展。

马斯克挖角 NVIDIA 核心团队,xAI 加速 “世界模型” 研发
马斯克旗下xAI公司正加速开发“世界模型”,以推动通用人工智能(AGI)发展。为此,公司从英伟达挖来两位核心研究员Zeeshan Patel和Ethan He,他们在Omniverse平台有重要贡献,将为xAI带来技术专长。

国内AI助手通义千问和豆包开启记忆功能,力争超越ChatGPT
阿里巴巴的“通义千问”和字节跳动的“豆包”AI助手启动记忆功能内测,旨在对标OpenAI的ChatGPT。此举推动国产AI从即时问答工具向长期私人助理转型,紧跟行业领先者步伐。

Sora by OpenAI 即将登陆安卓平台,预注册已在北美开启
OpenAI视频生成应用Sora即将登陆安卓平台,目前在谷歌Play商店已开放美加地区预注册,与iOS版初期策略一致。该应用暂不可下载,引发广泛关注。

OpenAI 与 Sur Energy 签署协议:25亿美元阿根廷数据中心项目启动
OpenAI与阿根廷Sur Energy公司签署意向书,计划投资250亿美元在阿根廷建设大型数据中心。该项目具备500兆瓦运算能力,将成该国史上最大信息技术和能源基础设施项目之一,专门支持先进AI计算,并适用阿根廷RIGI税收减免计划。

日本政府对 OpenAI Sora 2 发布版权警告,要求遵守法律规定
日本政府要求OpenAI禁止Sora2生成侵犯版权内容,特别针对其模仿日本动画风格的能力。此举旨在保护本国动漫产业,该产业被视为经济文化核心。

Android 用户福音:OpenAI Sora 登陆 Google Play,已开放北美预注册
OpenAI旗下AI视频生成应用Sora继登陆苹果App Store后,现已在谷歌Google Play商店开放预注册,即将正式登陆安卓平台。目前仅限美国和加拿大用户参与预注册,与iOS版本上线模式一致。