苹果AI/ML团队联手哥伦比亚大学成功突破谷歌人机验证码挑战

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Oct 12, 2023

苹果AI/ML团队与哥伦比亚大学合作开发的多模态大模型“雪貂”（Ferret）成功挑战谷歌人机验证码，能识别交通信号灯并提高大模型在“看说答”任务中的准确度。Ferret的创新在于融合引用和定位的空间理解能力，同时理解语义和目标，不同于传统多模态模型。使用混合区域表示方法，结合离散坐标和连续特征，模型在多任务评估中表现出色，特别在指代和视觉grounding任务上。这一突破是由中国团队取得，凸显了中国在多模态大模型研究中的实力，为图像理解和多模态任务提供新方向。Ferret的成就有望在人机交互和智能搜索等领域取得重要突破。

大模型 AI头条

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

内容创作的ClaudeCode：深度测评Loomi，如何用IDE思维终结套壳Agent时代？

Loomi在众多AI创作工具中脱颖而出，通过联网搜索、深度研究、文件整理等专业功能，实现从素材搜集到内容输出的系统化流程，真正做到了内容工程而非碰运气。

2025年12月30号 17:47

2025年AI应用新格局：翻译、搜索、浏览器全新进化！

2025年，AI应用场景发生巨变，各领域积极融入日常生活，从翻译、搜索到浏览器，深刻改变工作和生活方式。AI翻译竞争激烈，专业软件展现强大反击能力，如网易有道推出升级版翻译大模型2.0。

2025年12月30号 17:45

210

隐私不再是问题！WitNote—— 你的离线 AI 笔记助手

WitNote是一款完全离线的AI笔记工具，由独立开发者推出，旨在解决用户对在线AI工具隐私和订阅费用的担忧。它支持Windows和macOS平台，允许用户在本地使用大语言模型处理笔记，无需联网，从而避免数据泄露和月费负担。用户只需下载并运行即可使用。

2025年12月30号 17:34

教育部专家杨宗凯：重塑教育新生态，“平台+数据+AI+政策”四位一体是关键

教育部专家强调，为实现教育领先优势，需在“十五五”及未来推动平台、数据、AI工具与政策“四位一体”协同，系统性深化教育改革，构建面向未来的教育新生态。

2025年12月30号 17:29

法拉第未来计划更名，引入人工智能以提升品牌形象

法拉第未来将于2026年2月召开特别股东大会，就多项提案进行投票，其中关键一项是将公司名称从“Faraday Future Intelligent Electric”更改为“Faraday Future AI Electric Vehicle Inc.”，以突出其在人工智能电动汽车领域的战略定位。

2025年12月30号 16:57

教育部:加快建设自主可控教育大模型，构建全域贯通的数据支撑体系

教育部专家杨宗凯强调，未来保持教育数字化全球领先的关键在于平台、数据、AI工具与政策的高度协同，以重塑教育生态。首要任务是深化集成化改革，通过建设国家教育大数据中心，构建招生、教学、管理到就业的全域贯通体系，实现数据“一数一源”。

2025年12月30号 16:41

210

AI日报：Meta宣布收购Manus；腾讯混元发布1.5版开源翻译模型；OpenAI更新手机版ChatGPT

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解：https://app.aibase.com/zh1、Meta宣布收购Manus，交易金额高达数十亿美元Meta宣布以数十亿美元收购人工智能初创公司Manus，这是其历史上第三大收购案。ClaudeCode可视化工作流编辑器爆火：拖拽节点就能建AI自动化神器文章介绍了ClaudeCodeWorkflowStudio这一VSCode扩展工具的发布及其对AI自动化工作流的影响，强调其可视化和无代码特性降低了使用门槛，并提升了用户体验。

2025年12月30号 16:25

腾讯混元发布1.5版开源翻译模型:端侧部署性能跃升，效果比肩超大型闭源模型

腾讯混元开源翻译模型1.5版本，推出1.8B和7B两个尺寸模型，主打高效与高质量翻译，优化端云协同体验。其中1.8B模型专为手机等设备设计，量化后仅需1GB内存即可离线流畅运行，实现端侧部署与卓越性能。

2025年12月30号 15:51

330

三星 Exynos 2600 芯片助力 AI 技术飞跃，模型体积缩减 90%！

三星新一代Exynos2600芯片将整合Nota公司的AI模型优化技术，可在保持高精度的同时将模型体积缩小90%以上，为移动设备AI应用提供支持。这是Nota继Exynos2500后再次获得三星旗舰芯片订单，凸显其在AI优化领域的技术实力。

2025年12月30号 15:45

260

端侧AI翻译新突破:腾讯混元1.5版开源，手机也能实时多语种互译

腾讯开源混元翻译模型1.5版，支持33种语言互译，专为移动端优化。提供1.8B和7B两个版本，其中1.8B版经量化后仅需1GB内存，可在手机等设备上实现离线实时翻译，推理速度出色。

2025年12月30号 15:38

280

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO品牌监控分析

GEO排名查询工具

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

苹果AI/ML团队联手哥伦比亚大学成功突破谷歌人机验证码挑战

站长之家

本文来自AIbase日报

相关AI新闻推荐

内容创作的ClaudeCode：深度测评Loomi，如何用IDE思维终结套壳Agent时代？

2025年AI应用新格局：翻译、搜索、浏览器全新进化！

隐私不再是问题！WitNote—— 你的离线 AI 笔记助手

教育部专家杨宗凯：重塑教育新生态，“平台+数据+AI+政策”四位一体是关键

​法拉第未来计划更名，引入人工智能以提升品牌形象

教育部:加快建设自主可控教育大模型，构建全域贯通的数据支撑体系

AI日报：Meta宣布收购Manus；腾讯混元发布1.5版开源翻译模型；OpenAI更新手机版ChatGPT

腾讯混元发布1.5版开源翻译模型:端侧部署性能跃升，效果比肩超大型闭源模型

三星 Exynos 2600 芯片助力 AI 技术飞跃，模型体积缩减 90%！

端侧AI翻译新突破:腾讯混元1.5版开源，手机也能实时多语种互译

相关AI新闻推荐

内容创作的ClaudeCode：深度测评Loomi，如何用IDE思维终结套壳Agent时代？

2025年AI应用新格局：翻译、搜索、浏览器全新进化！

隐私不再是问题！WitNote—— 你的离线 AI 笔记助手

教育部专家杨宗凯：重塑教育新生态，“平台+数据+AI+政策”四位一体是关键

​法拉第未来计划更名，引入人工智能以提升品牌形象

教育部:加快建设自主可控教育大模型，构建全域贯通的数据支撑体系

AI日报：Meta宣布收购Manus；腾讯混元发布1.5版开源翻译模型；OpenAI更新手机版ChatGPT

腾讯混元发布1.5版开源翻译模型:端侧部署性能跃升，效果比肩超大型闭源模型

三星 Exynos 2600 芯片助力 AI 技术飞跃，模型体积缩减 90%！

端侧AI翻译新突破:腾讯混元1.5版开源，手机也能实时多语种互译

法拉第未来计划更名，引入人工智能以提升品牌形象

法拉第未来计划更名，引入人工智能以提升品牌形象