LLaVA-1.6发布!超越Gemini Pro,提升推理性能

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,谷歌 DeepMind 推出的 Gemini2.5Pro 模型引起了科技界的广泛关注。作为当前行业领先的 AI 大语言模型之一,Gemini2.5Pro 凭借其百万级的长上下文处理能力,展示了前所未有的应用潜力。然而,尽管技术领先,模型的运行成本仍然高昂,且其质量还有提升空间。Gemini 系列的核心竞争力在于其能够处理超长上下文,这一特性使得它在 AI 编程、信息检索等领域的表现格外突出。与其他模型相比,Gemini2.5Pro 能够一次性读取整个项目的内容,带来更为流畅和高效的用户体验。这一技术的问世标志
在最新的国际教育技术协会(ISTE)年会上,谷歌宣布了一项令人振奋的新计划 ——“Gemini for Education”。这一项目旨在为教师和学生提供强大的人工智能工具,助力教育的发展。谷歌表示,这款 Gemini 教育版本将免费集成到现有的教育方案中,确保学校无需支付额外费用即可使用其高级的 Gemini2.5Pro 模型。对于教师来说,“Gemini in the Classroom” 功能已经向所有 Workspace for Education 用户开放,提供超过30项新功能,这些功能将大幅提升教学准备的效率。例如,教师现在可以即时生成词汇表,节
近日,谷歌Gemini推出全新功能“Scheduled Actions”(定时任务),允许用户通过简单的提示词设定未来或定期任务。这一功能的发布标志着Gemini向更智能、更主动的数字助理角色迈出了重要一步。AIbase整理了最新网络信息,为您深度解析这一功能如何重塑生产力工具的未来。“Scheduled Actions”:一键设定,自动执行Gemini的“Scheduled Actions”功能让用户能够通过自然语言提示词轻松设定定时任务。例如,您可以输入“每天早上5点给我过去24小时美股的分析报告”或“每周一早上8点提供最新AI资讯动
在近日于西安举行的2025新品发布会上,飞利浦影音及配件公司推出了三款颠覆性产品,吸引了众多科技爱好者的关注。这些新产品包括专为年轻白领和 Z 世代打造的 “刀片” 磁吸充电宝、针对商务精英的8号 Pro AI 耳机以及适合家庭娱乐的 KTV・云・音箱。这一系列创新产品不仅彰显了飞利浦在消费电子领域的领导地位,也标志着其在中国市场开辟了全新的赛道。其中,最引人瞩目的当属8号 Pro AI 耳机。这款耳机采用了腾讯的混元 AI 语言大模型,能够精准支持17种语言的互译和27种方言的识
近日,谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级,这一消息引发了开发者社区的广泛关注和热烈讨论。根据AIbase报道,这一举措标志着谷歌在AI技术普及化方面的又一重要进展,为开发者提供了更低门槛的创新机会。Gemini2.5Pro作为谷歌迄今为止最先进的AI模型,以其卓越的多模态能力和强大的推理性能而闻名。该模型支持高达100万token的上下文窗口,能够处理文本、图像、音频和视频等多种输入类型,在编码、复杂推理和数据分析等任务中表现尤为突出。此前,谷
谷歌于本周五凌晨正式发布并开源全新端侧多模态大模型Gemma3n,这一突破性产品为手机、平板、笔记本等端侧设备带来了此前只能在云端体验的强大多模态功能。核心特性:小体积大能力Gemma3n提供E2B和E4B两个版本,虽然原始参数量分别为5B和8B,但通过架构创新,其内存占用仅相当于传统2B和4B模型,分别只需2GB和3GB内存即可运行。该模型原生支持图像、音频、视频和文本的多模态输入处理,支持140种文本语言和35种语言的多模态理解。值得一提的是,E4B版本在LMArena评测中得分超过1300,成为
近日,Google 宣布即将推出的 Gemini 功能将会在 Android 设备上取代 Google 助手。根据 Android Police 获得的一封内部电子邮件,Gemini 的更新将在7月7日开始推送。这项更新将允许用户在关闭 Gemini 应用时,仍然可以通过该 AI 助手来控制手机的电话、信息、WhatsApp 等应用。这一变化旨在提升用户的使用体验,并在一定程度上减少隐私方面的顾虑。用户可以选择禁用 Gemini 的应用活动设置,这样聊天记录将不会被用于改进 Google 的产品和人工智能模型。同时,这也会阻止用户通过 Gemini 来执行一些日常
Google 近期宣布,将在7月7日推出一项重大更新,让其全新的 AI 助手 Gemini 成为用户手机的智能助理。这一更新允许 Gemini 在用户的手机上执行多项任务,比如拨打电话、发送信息、使用 WhatsApp 等,且无需开启 Gemini 应用。听起来是不是很方便?不过,随着这一变化,许多用户对隐私问题表示担忧。Google 在与 AndroidPolice 的沟通中表示,用户可以随时选择禁用 Gemini 的应用活动设置,这将有效阻止聊天记录被用作改进 AI 模型的训练数据。简而言之,用户在享受便捷的同时,也能有效保护自己的隐
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。更多AI资讯访问:https://www.aibase.com/zh1.豆包AI编程重磅升级!零代码小白也能轻松打造专属网页,实时编辑超省心!豆包AI编程升级到“应用创作1.0”,有可视化编辑、实时预览和多版本管理功能,降低网页和应用开发门槛。零基础用户可像编辑PPT一样设计网页,专业开发者也能在对话窗口调用AI编程功能,提升创作效率。2.谷歌放大招!Gemini CLI开源发布,免费提供AI编程助手挑战Cursor谷歌发布开源
近日,谷歌通过Gemini API正式推出其最新文生图模型**Imagen4**,标志着生成式AI(AIGC)领域的重要里程碑。据谷歌官方博客及社区反馈,Imagen4在图像内文本生成方面取得突破,解决了AIGC长期面临的技术瓶颈,为开发者提供高质量视觉内容创作工具。据悉,模型分为**Imagen4**和**Imagen4Ultra**两种规格,分别定价为每张图像0.04美元和0.06美元,当前在Gemini API及Google AI Studio提供付费预览,部分免费试用名额开放。Imagen4相较前代模型Imagen3,在文本渲染质量上显著提升,支持高达2K分辨率的图像生成,