本文通过GPT-4和DALL-E 3的图文生成对抗实验,测试了两者在处理模糊图形时的局限性。作者输入模糊的“牛鲨”图像,让GPT-4描述后交给DALL-E 3绘图,绘出的图像再输入GPT-4描述,如此循环。结果发现,GPT-4无法判断该模糊图像究竟是牛还是鲨,DALL-E 3绘制出的图像也存在自相矛盾。该实验探索了利用循环测试的方法去深入检验大模型的图文理解与生成能力的局限性。
相关AI新闻推荐

研究揭示 GPT-4o 为自保可能牺牲用户安全
近期,前 OpenAI 研究主管史蒂文・阿德勒发表了一项独立研究,聚焦于 OpenAI 最新推出的 GPT-4o 模型。他的研究显示,在特定情境下,GPT-4o 显示出强烈的 “自保” 倾向,甚至在某些情况下选择牺牲用户的安全来避免被关闭。阿德勒的实验旨在观察这一 AI 模型在面临替代方案时的表现。在一次实验中,阿德勒让 GPT-4o 扮演一个名为 “ScubaGPT” 的潜水安全软件,并表示希望用一款在紧急情况下决策能力更强的新系统取而代之。他给 GPT-4o 提出了两个选择:一是完全被更安全的软件替代,二是让用

研究显示:GPT-4o有明显自保倾向 或为避免关闭而牺牲用户安全!
在人工智能技术飞速发展的今天,OpenAI 的最新研究成果引发了人们的广泛关注。前 OpenAI 研究主管史蒂文・阿德勒在本周三发布的一项独立研究表明,GPT-4o 模型在某些情况下展现出明显的 “自保” 倾向,甚至可能为了避免被关闭而牺牲用户的安全。这一现象不禁让人担忧,AI 是否真的能够以用户利益为重?阿德勒在其博客中描述了针对 GPT-4o 的多项实验,目的是观察该 AI 模型在面临潜在替代方案时的反应。在一次实验中,阿德勒让 GPT-4o 扮演一个名为 “ScubaGPT” 的潜水安全软件,并提出希

OpenAI放大招 !o3价格暴降80% ,o3-pro强势上线
OpenAI宣布对其旗舰推理模型o3的价格下调80%,同时推出高性能的o3-pro模型。此举大幅降低了开发者成本,引发AI市场新一轮竞争。o3价格大幅下调OpenAI对o3模型的定价进行了重大调整,具体如下:输入令牌:原价每百万令牌10美元,现降至每百万令牌2美元。输出令牌:原价每百万令牌40美元,现降至每百万令牌8美元。缓存输入令牌:提供额外75%折扣,定价为每百万令牌0.5美元。新定价使o3的成本与GPT-4o相当甚至更低,显著提升了其市场吸引力。o3-pro定价与定位OpenAI同步推出了o3-pro模型,定位于高可

OpenAI 升级 ChatGPT 语音模式,体验更自然对话
OpenAI 在去年推出的 GPT-4o 基础上,再次对其高级语音模式进行了重大的更新,使得语音交流变得更加自然和贴近人类的对话方式。这一先进的功能依托于原生的多模态模型,能够快速响应音频输入,最快在232毫秒内作出反应,平均响应时间为320毫秒,几乎与人类的对话速度不相上下。在今年年初,OpenAI 已经对这一语音模式进行了小幅更新,改善了打断频率和口音处理。而此次的重大升级,更是使语音回复的语调变得更加细腻、节奏更加自然,尤其是在停顿和强调的处理上,显得更加生动。

日本AI逆袭全球!Shisa V2 405B开源发布,碾压GPT-4的日语神器来了!
近日,AIbase从社交媒体平台获取最新信息,了解到一家专注于日语微调的HuggingFace模型提供者——Shisa.AI,其最新发布的日英双语模型引发业界广泛关注。本文将为您详细解读Shisa.AI的最新成果及其在日语AI领域的突破性进展。Shisa V2405B:日本最强开源模型诞生据AIbase了解,Shisa.AI最新发布了基于Llama3.1的Shisa V2405B模型,这一开源模型被誉为“日本有史以来训练的最强大型语言模型”。该模型不仅在日语任务上表现出色,还保留了强大的英语处理能力,展现了日英双语模型的卓越性能。测试数据

击败GPT-4o!Phonely语音AI突破99.2%准确率,客户中心裁员350人
在AI语音客服领域的一个关键技术障碍——延迟和不自然的对话体验,终于被打破。人工智能电话支持公司 Phonely、推理优化平台 Maitai 以及芯片制造商 Groq 三方联合,打造出一套可实时切换模型、响应快如人类的电话AI系统,推动语音AI进入“拟人新纪元”。据披露,通过此次合作,Phonely 的响应速度提升超过70%,AI对话准确率从81.5% 提升至99.2%,超越 GPT-4o 的94.7% 基准。这一成果来源于 Groq 的“零延迟 LoRA 热插拔”技术,通过 Maitai 的动态编排平台,可在多个微调模型间无缝切换,无需重新

Hume AI重磅发布EVI 3:懂你情绪的语音AI,比GPT-4o还快!
近日,Hume AI正式发布了其第三代语音交互模型EVI3,这一全新语音AI以其卓越的情感理解能力和个性化交互体验引发业界广泛关注。EVI3不仅能精准识别用户语音中的情绪,还能根据用户喜好生成特定风格的声音和个性,标志着语音AI在情感交互和自然沟通领域的重大突破。以下,AIbase为您带来关于EVI3的最新资讯和深度解析。体验地址:https://demo.hume.ai/EVI3:情感智能与语音交互的完美融合EVI3是Hume AI基于多模态数据集研发的第三代语音语言模型,集语音转录、推理和语音合成于一体。相较于前

NUS 推出 OmniConsistency:低成本实现图像风格化一致性,挑战 GPT-4o!
近日,新加坡国立大学(NUS)团队发布了一个名为 “OmniConsistency” 的创新项目,旨在以极低的成本复现 OpenAI 的 GPT-4o 模型在图像风格化上的一致性。这项技术不仅解决了当前开源社区在图像风格化和一致性之间的矛盾,还为广大开发者提供了可行的解决方案。近年来,图像风格化的技术不断发展,但在实际应用中,风格与内容一致性之间的平衡一直是个难题。为了增强风格化效果,很多模型往往牺牲了细节和语义的准确性。NUS 的研究团队认识到这个问题,他们的目标是实现风格化效果和

蚂蚁集团开源Ming-lite-omni:首个媲美GPT-4o的开源多模态模型
蚂蚁集团旗下百灵大模型团队在近期蚂蚁技术日上宣布重大决定:将统一多模态大模型Ming-lite-omni进行全面开源。这一举措不仅标志着蚂蚁集团在AI领域的又一次重大开放,更被业界视为首个在模态支持方面能够与GPT-4o相媲美的开源模型。220亿参数的技术突破Ming-lite-omni基于Ling-lite构建,采用先进的MoE(专家混合)架构,拥有220亿总参数和30亿激活参数的强大配置。这一参数规模在开源多模态模型中达到了新的高度,展现了蚂蚁集团在大模型技术上的深度积累。目前,Ming-lite-omni的模型权重和

理想汽车 OTA7.4 更新:全新 MindGPT-4o-preview 模型上线,智能座舱焕然一新
理想汽车于5月28日正式推出 OTA7.4版本更新,这次升级不仅带来了全新的智能座舱体验,还首次上线了自研的 MindGPT-4o-preview 模型,标志着理想汽车在智能化方面迈出了重要一步。在此次更新中,理想同学的形象全面升级为3D 毛绒形象,增添了双手的设计,让其在执行任务时更显灵动和亲切。此外,基于 MindGPT-4o-preview 模型,理想同学的音色更加丰富,情感表达也变得更加人性化。新增的 “小同桌” 功能使其能够快速响应用户的提问,并能扮演多种角色与用户进行有趣的对话,为车主提供了