Together AI发布RedPajama v2:30万亿token数据集用于大型语言模型训练

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
近日,夸克正式发布健康大模型技术报告《QuarkMed Technical Report》,首次公开了“主任医师级”能力的技术实现细节。QuarkMed Technical Report此前,夸克健康大模型成功通过了中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。在与通用模型对比中,夸克健康大模型呈现出“难度越高、领先优势越明显”的性能曲线,尤其是在复杂医学推理任务中实现突破。本次技术报告系统披露了这一突破背后的关键路径与技术亮点。面对医疗模型需要高质量、高专业度训练数据的问
近日,谷歌在其研究中提出了一种新颖的主动学习筛选流程,旨在大幅降低微调大型语言模型所需的训练数据量。根据实验结果,这种方法能够将训练数据量降低至原来的1万分之一,同时提高模型与人类专家判断的一致性达65%。在实际应用中,如广告内容分类、金融数据安全分析等领域,对高保真训练数据的需求一直很高,但筛选出符合要求的数据不仅难度大,成本也极为昂贵。图源备注:图片由AI生成,图片授权服务商Midjourney这一新方法从一个零样本或少样本的初始模型开始,用户通过
据国外媒体报道,苹果研究团队近日发布了适配版的SlowFast-LLaVA模型,该模型在长视频分析理解任务上表现出色,其性能甚至超越了参数规模更大的模型。这项突破为长视频内容分析提供了高效的全新解决方案。该模型的核心优势在于其双流架构,这一设计有效解决了传统逐帧处理模式下的信息冗余和上下文窗口溢出问题。慢流(Slow) 以低帧率捕捉场景中的静态细节和背景信息,而快流(Fast) 则以高帧率追踪动作的快速变化。这种协同工作模式极大地优化了视频处理效率。在长视频基准测
AIbase报道 8月25日,钉钉在十周年之际发布8.0版本,正式推出下一代AI办公应用形态——钉钉ONE。这标志着钉钉对AI时代办公应用形态的全新定义和探索。钉钉ONE被设计为人与AI通过自然语言对话的统一入口,致力于打造全球首个以Agent驱动的工作信息流。据介绍,该产品让工作处理变得"像刷短视频一样丝滑",为用户提供前所未有的办公体验。这一创新设计代表了钉钉对未来办公模式的前瞻性思考,将复杂的工作流程简化为直观的自然语言交互,大幅降低了AI办公的使用门槛。在十周年庆典上
法律界迎来了一位"数字包青天"!在第五届"小包公杯"大学生法律实证分析征文比赛颁奖典礼上,华南师范大学法学院王燕玲教授团队重磅发布了我国首个法律领域垂直大模型——"小包公法律内容大模型",这一突破性成果标志着中国法律科技正式迈入AI原生时代。这款经过国家互联网信息办公室深度合成服务算法备案的法律AI,采用了业界领先的"先进通用大模型+专业垂直大模型"双引擎架构。这种创新设计让模型既拥有广博的通识基础,又能够在法律专业领域深耕细作,真正做到了"上知天文
近日,研究人员进行了一项大规模语言学分析,挑战了长期以来关于语言变化的传统观念。该研究发现,老年人不仅会跟随年轻人的脚步,甚至在某些情况下,他们会主动引领语言的变化。此次研究的成果发表于《美国国家科学院院刊》。图源备注:图片由AI生成,图片授权服务商Midjourney研究团队分析了近790万篇1873年至2010年间美国国会演讲的文本。这些演讲由数千名已知年龄的发言者发表,为分析语言行为提供了宝贵机会。研究者们重点关注约100个在20世纪可能发生意义变化的单词,例如
据最新报道,苹果公司正在探索与谷歌合作,计划为2026年发布的Siri升级版引入定制版 Gemini 大模型。此举标志着苹果正积极寻求外部合作伙伴,以期大幅提升其语音助手的AI能力。消息人士透露,双方已就定制化模型展开接洽,而谷歌方面也一直在其服务器上测试能在苹果硬件上运行的模型。如果合作达成,这将是苹果为强化Siri功能所采取的最新且最重大的举措之一。这一潜在合作背后,是苹果在AI领域日益增长的竞争压力。尽管Siri是首批进入市场的主流语音助手,但其功能和智能化程度
Cohere 近日发布了其全新的语言模型 Command A Reasoning,旨在满足商业环境中对高难度推理任务的严苛需求。该模型在处理代理工作流、构建端到端系统和分析大型文档方面表现出色。据Cohere介绍,Command A Reasoning在多项行业基准测试中表现卓越,其性能超越了其他私有模型,包括 BFCL-v3、Tau-bench 和 DeepResearch Bench。该模型具有强大的技术能力,能够在一个 H100或 A100GPU上运行,支持高达 128,000个令牌的上下文窗口;在多GPU配置下,上下文窗口可扩展至 256,000个令牌。企业可以灵活设置令牌预算,
AI训练数据的价值评估终于告别玄学时代了!上海人工智能实验室OpenDataLab团队正式发布OpenDataArena开放数据竞技场,这一突破性平台将彻底改变研究人员筛选训练数据的方式,让数据价值评估从模糊的"黑盒操作"转变为精确的科学测量。长期以来,AI研究者在面对海量训练数据时常常陷入困境:哪些数据真正有价值?如何快速识别高质量数据集?这些问题让数据筛选工作宛如"炼丹"般充满不确定性。OpenDataArena的出现为这一痛点提供了系统性解决方案。这个革命性平台构建了公平、公开、透明的数据