压缩模型文本提示,极大节省 AI 算力

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
随着互联网的发展,搜索引擎似乎变得愈发臃肿,广告和推销内容的增多让用户感到困扰。如今,很多人已经习惯在寻找信息时先选择 “谷歌一下,某某某 Reddit”。这不仅是一种幽默,也反映了人们对 Reddit 这一社区的信赖,因为用户提供的信息往往更为真实和有用。为了解决这一问题,Reddit 在去年的时候推出了 “Reddit Answers” 功能,这是一种结合人工智能的工具,旨在为用户提供更为简洁的回答。此前,用户只能在 Reddit 特定的区域访问该功能。但近日,Reddit 宣布将把这一 AI 工具整合
随着人工智能技术的迅猛发展,艺术创作领域也悄然发生着变化。美国版权局最近透露,已成功注册超过1000件通过人工智能增强的作品。这一举措标志着版权法律在应对新兴科技方面的重要进展。在一篇最近的采访中,版权局助理总法律顾问贾莉斯・曼金(Jalyce Mangum)表示,艺术家在申请注册时,需按照指导原则披露和放弃 AI 生成的内容。曼金指出,版权局会评估 AI 在作品中是如何增强人类创作表达的,以及 AI 是否是表达选择的主要来源。简单来说,如果一幅作品的核心是由人类创作
近日,一篇名为《排行榜幻觉》的论文在学术界引发了广泛关注,尤其是对大型语言模型(LLM)领域中备受推崇的 Chatbot Arena 排行榜提出了严厉质疑。研究指出,排行榜的可信度因数据访问不平等、模型私下测试等问题而受到挑战。论文显示,一些大型科技公司可以在公开发布之前对多个模型版本进行私下测试。例如,Meta 在发布 Llama4之前测试了多达27个版本,然后只对外公布表现最佳的模型。这种 “最佳选择” 策略不仅导致了模型排行榜的膨胀,还可能误导用户对模型真实能力的判断。
在人工智能领域的持续快速发展中,近日有消息称微软的 Azure 云平台将会托管马斯克的 Grok AI 模型。这一消息引发了业内广泛关注,特别是在 AI 技术日益成为企业和社会各个层面的重要工具的背景下。Grok AI 是一款旨在提供智能辅助的 AI 工具,能够帮助用户更高效地处理信息和做出决策。与此同时,谷歌也不甘示弱,宣布将开始在实验室外测试其 AI 搜索模式。这一模式的测试意味着谷歌希望能够通过 AI 技术提升搜索引擎的精准度和用户体验,让信息获取变得更加便捷和智能。谷歌搜索一
在现代快节奏的生活中,学习的方式正在发生革命性的变化。5月2日,百度网盘联合百度文库推出了一款名为 “AI 笔记” 的新功能,旨在提升用户在视频学习时的效率,宣称可使学习效率提升达10倍。这个功能的推出,完美解决了用户在学习过程中频繁切换平台的繁琐操作。过去,用户在观看学习视频时,往往需要不断地暂停、截屏、记录笔记、插图以及批注。这一系列的操作不仅耗时耗力,还容易导致学习的断层和效率低下。为了应对这一挑战,百度网盘的 “AI 笔记” 功能提供了全自
近日,有消息透露,苹果公司正在与人工智能初创企业 Anthropic 合作,共同开发一个全新的软件平台,命名为 “氛围编码”(vibe-coding)。这个平台的主要目的是利用人工智能来代替程序员进行代码的编写、编辑和测试,从而提升开发效率。据知情人士透露,这一创新系统是苹果著名开发软件 Xcode 的新版本,将会整合 Anthropic 的 Claude Sonnet 模型。通过引入这一先进的人工智能技术,苹果希望在内部提高工作流程的效率,以便加速产品开发的进程,并实现现代化。图源备注:图片由AI生成,图
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。Phi-4-reasoning 拥有140亿个参数,并借鉴OpenAI o3-mini的推理路径,通过监督微调进行训练。更高级的Phi-4-reasoning-plus在此基础上增加了强化学习机制,处理的tok
人工智能领域知名的公共基准测试平台LMArena近日遭遇信任危机。一项新的研究指出,该平台的排名系统存在偏袒OpenAI、谷歌和Meta等大型供应商的结构性问题,其不透明的流程和头部企业的固有优势可能导致排名失真。然而,LMArena运营团队已公开否认这些指控。LMArena通过向用户展示不同大型语言模型(LLM)的回复对比,并由用户投票选出更优者,最终形成广泛被行业引用的模型性能排行榜。企业常借此展示自身模型的优越性。但由Cohere Labs、普林斯顿大学和麻省理工学院的研究人员联合进
美国劳工统计局最新数据显示,美国年轻大学毕业生进入职场后面临的期望与现实之间的差距已降至历史最低水平,表明新毕业生就业形势严峻。《大西洋月刊》分析指出,这一转变或由多重因素叠加所致,其中生成式人工智能的崛起被认为是关键因素之一。哈佛大学经济学家戴维·戴明警告称,生成式人工智能擅长信息整合、报告撰写和演示制作,而这些恰恰是年轻大学毕业生在办公室中的主要工作内容,暗示AI正在逐步取代初级岗位。然而,就业困境并非完全归咎于人工智能。《大西
工智能公司Anthropic向白宫发出呼吁,要求进一步加强针对人工智能扩散的出口管制。这些出口管制自今年五月中旬起,将限制或禁止将高端 GPU 及加速器出售给中国及部分国家。Anthropic表示,现有的出口管制措施仍不足以遏制走私芯片流入中国,从而推动其人工智能的持续进步。Anthropic在一份简报中指出,中国在一月份发布的免费大型语言模型(LLM)已经在某些基准测试中超越了美国公司的模型,这让许多西方人工智能公司感到担忧。针对美国政府发布的三层次出口管制方案,Anthropic希望