谷歌发布开源大模型 Gemme,转变开源策略

甲子光年
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
根据数字市场智能公司 Similarweb 的最新报告,来自 ChatGPT 对新闻出版商的流量推荐正在逐步增长,但这一增长尚不足以抵消用户通过 AI 或 AI 驱动的搜索结果直接获取新闻所导致的点击下降。自2024年5月谷歌推出 AI 概览以来,网络新闻搜索中没有点击新闻网站的比例从56% 上升至近69%。这意味着,越来越多的用户在搜索新闻时并未点击任何链接,直接通过 AI 获得信息。同时,整体的有机流量也呈现下滑趋势,从2024年中期的超过23亿次访问降至目前的不到17亿次。尽管如此,ChatGPT 中与新闻相
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、字节跳动EX-4D震撼开源:单目视频秒变自由视角4D大片EX-4D是字节跳动PICO-MR团队推出的4D视频生成框架,能够从单目视频生成高质量、多视角的4D视频序列。该技术通过深度密闭网格(DW-Mesh)和轻量级适配架构,解决了传统视频生成技术在多视角生成中的挑战,并在性能指标上全面领先。【AiBase
字节跳动宣布开源VINCIE-3B,一款支持上下文连续图像编辑的3亿参数模型,基于其内部MM-DiT架构开发。这款模型突破了传统图像编辑的局限,首次实现从单一视频数据中学习上下文感知的图像编辑能力,无需依赖复杂的分割或修复模型生成训练数据。VINCIE-3B的发布为创意设计、影视后期及内容生成领域带来了全新的可能性。AIbase深入剖析其技术亮点、应用场景及行业影响。技术突破:从视频到上下文编辑传统图像编辑模型通常依赖任务特定的数据管道,需通过专家模型(如分割、修复)生成
毕马威中国近日发布的《首届健康科技50》报告揭示,中国在医疗大模型领域已占据全球主导地位。报告指出,在全球已发布的医疗大模型中,中国发布数量占比超过70%,远超其他国家和地区。从模型类别来看,大语言模型(LLM)数量最多,占比接近65%。此外,报告还强调了中国智能医疗器械市场的强劲增长势头。预计到2025年,中国智能医疗器械市场规模将达到242.3亿元,并在2026年至2027年间有望继续保持较高速度增长。这一系列数据表明,中国在健康科技,特别是医疗人工智能和智能医疗
Bilibili(B站)宣布其开源动漫视频生成模型AniSora迎来重大更新,正式发布AniSora V3。作为Index-AniSora项目的一部分,V3版本在原有基础上进一步优化了生成质量、动作流畅度和风格多样性,为动漫、漫画及VTuber内容创作者提供了更强大的工具。AIbase深入解读AniSora V3的技术突破、应用场景及行业影响。技术升级:更高质量与精准控制AniSora V3基于Bilibili此前开源的CogVideoX-5B和Wan2.1-14B模型,结合强化学习与人类反馈(RLHF)框架,显著提升了生成视频的视觉质量和动作一致性。其支持一键
Perplexity 现已推出每月200美元的 AI 订阅服务 Perplexity Max。这项新订阅旨在为用户提供一系列增强功能,包括访问“顶级高级 AI 模型”以及抢先体验即将推出的 Comet 浏览器等独家福利。Perplexity Max 订阅服务目前可在网页版和 iOS 应用上使用。Perplexity AI 是一家由前 Google AI 专家创办的初创公司,于2022年成立,并在短时间内凭借其独特的对话式搜索引擎获得了广泛关注。不同于传统的搜索引擎仅提供链接列表,Perplexity AI 能够直接为用户提供带有引用来源的摘要答案,使其在信息获取方面更加
大型语言模型(LLM)通过结合任务提示和大规模强化学习(RL)在复杂推理任务中取得了显著进展,如 Deepseek-R1-Zero 等模型直接将强化学习应用于基础模型,展现出强大的推理能力。然而,这种成功在不同的基础模型系列中难以复制,尤其是在 Llama 系列上。这引发了一个核心问题:究竟是什么因素导致了不同基础模型在强化学习过程中表现不一致?强化学习在 Llama 模型上的扩展限制OpenAI 的 o1、o3和 DeepSeek 的 R1等模型在竞赛级数学问题上通过大规模强化学习取得了突破,推动了对千亿参数以下小
谷歌于近日宣布推出全新AI工具套件Gemini for Education,基于其最新一代Gemini2.5Pro模型与专为教育优化的LearnLM学习型大模型,为全球师生提供免费、强大且高效的学习与教学支持。这一举措标志着谷歌在教育科技领域的又一重大突破,旨在通过AI技术赋能教育工作者和学生,打造更加个性化和高效的学习体验。Gemini for Education:专为教育场景打造的AI利器Gemini for Education是谷歌专为教育社区量身定制的AI工具,集成于Google Workspace for Education平台,面向所有使用该平台的学校免费开放。据悉,该工具
Stability AI联合芯片巨头Arm正式开源Stable Audio Open Small,一款专为移动设备优化的341M参数文本到音频生成模型。这款轻量化模型能在Arm CPU上本地运行,生成高质量立体声音频,标志着AI音频生成技术向边缘计算和移动设备的重大迈进。技术亮点:轻量高效,移动端本地生成Stable Audio Open Small基于Stability AI此前发布的Stable Audio Open模型,通过深度优化,参数量从1.1B压缩至341M,显著降低了计算需求。得益于Arm的KleidiAI库支持,模型能在智能手机上以不到8秒的速度生成最长11秒的44.1kHz立体声音频,无
字节跳动旗下PICO-MR团队正式开源了**EX-4D**,一款突破性的4D视频生成框架。这款工具能够从单一视角(单目)视频生成高质量、多视角的4D视频序列(3D空间+时间维度),标志着视频生成技术迈向了新的里程碑。EX-4D不仅在技术指标上超越现有开源方法,还为沉浸式3D内容创作和“世界模型”构建提供了关键支持。以下是AIbase对这一前沿技术的深入解读。 **技术突破:从单目视频到自由视角**传统视频生成技术在多视角生成方面面临两大挑战:一是需要昂贵的多视角相机和数据集进行训练;二是难以