LLM360:全球首个完全开源透明的大语言模型

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
随着生成式AI技术的飞速发展,视频修复领域迎来了新的突破。阿里云最新开源的Vivid-VR生成式视频修复工具,以其出色的帧间一致性和修复效果,迅速成为内容创作者和开发者的关注焦点。Vivid-VR:生成式AI驱动的视频修复新标杆Vivid-VR是阿里云推出的一款开源生成式视频修复工具,基于先进的文本到视频(T2V)基础模型,结合ControlNet技术,确保视频生成过程中的内容一致性。该工具能够有效修复真实视频或AIGC(AI生成内容)视频中的质量问题,消除闪烁、抖动等常见缺陷,为内容创作者提供
近日,夸克正式发布健康大模型技术报告《QuarkMed Technical Report》,首次公开了“主任医师级”能力的技术实现细节。QuarkMed Technical Report此前,夸克健康大模型成功通过了中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。在与通用模型对比中,夸克健康大模型呈现出“难度越高、领先优势越明显”的性能曲线,尤其是在复杂医学推理任务中实现突破。本次技术报告系统披露了这一突破背后的关键路径与技术亮点。面对医疗模型需要高质量、高专业度训练数据的问
近日,谷歌在其研究中提出了一种新颖的主动学习筛选流程,旨在大幅降低微调大型语言模型所需的训练数据量。根据实验结果,这种方法能够将训练数据量降低至原来的1万分之一,同时提高模型与人类专家判断的一致性达65%。在实际应用中,如广告内容分类、金融数据安全分析等领域,对高保真训练数据的需求一直很高,但筛选出符合要求的数据不仅难度大,成本也极为昂贵。图源备注:图片由AI生成,图片授权服务商Midjourney这一新方法从一个零样本或少样本的初始模型开始,用户通过
据国外媒体报道,苹果研究团队近日发布了适配版的SlowFast-LLaVA模型,该模型在长视频分析理解任务上表现出色,其性能甚至超越了参数规模更大的模型。这项突破为长视频内容分析提供了高效的全新解决方案。该模型的核心优势在于其双流架构,这一设计有效解决了传统逐帧处理模式下的信息冗余和上下文窗口溢出问题。慢流(Slow) 以低帧率捕捉场景中的静态细节和背景信息,而快流(Fast) 则以高帧率追踪动作的快速变化。这种协同工作模式极大地优化了视频处理效率。在长视频基准测
AIbase报道 8月25日,钉钉在十周年之际发布8.0版本,正式推出下一代AI办公应用形态——钉钉ONE。这标志着钉钉对AI时代办公应用形态的全新定义和探索。钉钉ONE被设计为人与AI通过自然语言对话的统一入口,致力于打造全球首个以Agent驱动的工作信息流。据介绍,该产品让工作处理变得"像刷短视频一样丝滑",为用户提供前所未有的办公体验。这一创新设计代表了钉钉对未来办公模式的前瞻性思考,将复杂的工作流程简化为直观的自然语言交互,大幅降低了AI办公的使用门槛。在十周年庆典上
今日,X-PLUG 团队在 GitHub 上正式发布了其最新项目 Mobile-Agent-v3,这是一款基于 GUI-Owl 的跨平台多代理框架。Mobile-Agent-v3具备强大的规划、进度管理、反思和记忆能力,旨在提升用户的 GUI 自动化体验。GUI-Owl 作为 Mobile-Agent-v3的基础模型,融合了感知、基础、推理、规划和执行等多项功能,是一款原生的端到端多模态代理。它的设计使得跨平台交互和多回合决策变得更加流畅,具有明确的中间推理能力。这意味着用户在进行多任务操作时,可以获得更为稳定的性能表现。X-PLUG 团队特别提到,
法律界迎来了一位"数字包青天"!在第五届"小包公杯"大学生法律实证分析征文比赛颁奖典礼上,华南师范大学法学院王燕玲教授团队重磅发布了我国首个法律领域垂直大模型——"小包公法律内容大模型",这一突破性成果标志着中国法律科技正式迈入AI原生时代。这款经过国家互联网信息办公室深度合成服务算法备案的法律AI,采用了业界领先的"先进通用大模型+专业垂直大模型"双引擎架构。这种创新设计让模型既拥有广博的通识基础,又能够在法律专业领域深耕细作,真正做到了"上知天文
近日,研究人员进行了一项大规模语言学分析,挑战了长期以来关于语言变化的传统观念。该研究发现,老年人不仅会跟随年轻人的脚步,甚至在某些情况下,他们会主动引领语言的变化。此次研究的成果发表于《美国国家科学院院刊》。图源备注:图片由AI生成,图片授权服务商Midjourney研究团队分析了近790万篇1873年至2010年间美国国会演讲的文本。这些演讲由数千名已知年龄的发言者发表,为分析语言行为提供了宝贵机会。研究者们重点关注约100个在20世纪可能发生意义变化的单词,例如