明略科技开源 TensorBoard.cpp 提升模型训练监测效率

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
硅基流动平台上线月之暗面开源的MoE模型Kimi K2,该模型总参数1T,激活参数32B,支持128K上下文长度,在编码和智能体任务中表现优异。定价为输入4元/百万Tokens、输出16元/百万Tokens。新用户注册可获14元试用金。模型具备三大技术优势:15.5T Tokens大规模训练、MuonClip优化器稳定扩展、专为智能体任务设计。测试显示其在编程、数学推理等方面表现突出,用户评价积极。平台同时上线编程大模型Kimi-Dev-72B,国内外用户均可体验。
【AI日报速览】1.月之暗面开源万亿参数Kimi K2大模型,采用混合专家架构,具备工具调用和代码执行能力。2.智源发布RoboBrain2.0和RoboOS2.0,提升机器人时空认知与多智能体协作能力。3.通义千问推出桌面客户端,新增图像生成等功能。4.IndexTTS2实现本地化语音克隆与情绪控制,革新配音技术。5.HuggingFace开源机器人Reachy Mini热销。6.Meta StreamDiT实现单GPU实时视频生成。7.PixVerse新增多关键帧生成功能。8.特斯拉Grok AI助手仅支持AMD处理器车型。9.OpenAI推迟开源模型发布以加强安全测试。10.Liquid AI开源边缘AI模型LFM2,性能显著提升。11.AI"时间穿越"挑战在社交媒体走红。
宇树科技获出版物零售许可,有效期至2030年。这家中国具身智能代表企业此前已新增出版物零售经营范围,2023年曾与机械工业出版社合作出版技术专著。此次获许可标志着宇树科技从机器人制造向知识传播领域拓展,将加速机器人教育、工程培训及开发者社区建设,推动行业人才培养与技术标准发展。
OpenAI宣布推迟发布首款开源权重大模型,CEO Sam Altman表示需要更多时间进行安全测试和风险评估。这款性能接近o3-mini的新模型可能命名为"开放模型",但开放程度尚不明确。研究副总裁Aidan Clark强调公司对开源标准严格,因模型发布后无法撤回。虽然推迟令部分用户失望,但OpenAI认为确保安全性和负责任的态度更为重要。这一决定将为未来模型应用奠定更安全的基础。
OpenAI宣布推迟开源大模型发布,CEO Sam Altman表示需要更多时间进行安全测试。该模型原计划本周发布,现推迟至下周,以确保其安全性与可靠性。Altman强调模型发布后无法撤回,必须谨慎对待。这是OpenAI首次尝试发布可下载的自主运行模型,旨在为研究人员和小型企业提供强大工具。虽然延期令人失望,但社区普遍理解安全测试的重要性,认为在AI生态系统中确保安全性是明智之举。
美国AI公司Perplexity CEO公开赞赏"月之暗面"新发布的Kimi K2万亿参数开源模型,表示可能基于该模型进行训练。Kimi K2采用混合专家架构,在代码生成、智能代理和数学推理等任务中表现优异,已在多项基准测试中取得领先成绩。Perplexity此前曾使用DeepSeek R1模型,此次表态显示其正积极寻求技术合作,以推动AI产品发展。Kimi K2的发布提升了"月之暗面"在开源模型领域的竞争力,也为行业带来新的技术可能性。
月之暗面发布万亿参数开源大模型Kimi K2,采用混合专家架构,激活参数达320亿。该模型具备自主调用工具和执行代码能力,在编程和数学测试中表现优异。公司采用MuonClip优化器提升训练效率,同时开放基础模型和API服务。此次发布标志着开源模型在通用智能领域与闭源系统形成实质性竞争,被视为继DeepSeek后最重要产品。用户可通过官网和Kimi App体验新功能,该模型有望推动AI技术在多场景的创新应用。
月之暗面公司正式发布了其最新力作——Kimi K2模型,并同步宣布开源。这款基于MoE架构的基础模型,凭借其强大的代码能力、卓越的通用Agent任务处理能力,一经发布便在AI领域引起了广泛关注。 Kimi K2模型总参数高达1T,激活参数为32B,在SWE Bench Verified、Tau2、AceBench等一系列基准性能测试中,均取得了开源模型中的顶尖成绩,充分展现了其在代码编写、Agent任务执行以及数学推理等方面的领先实力。
近日,腾讯云官网正式上线了腾讯混元A13B模型的API服务,输入价格定为每百万Tokens0.5元,输出价格则为每百万Tokens2元,这一举措迅速在开发者社区中引发了热烈反响。 作为业界首个13B级别的MoE(混合专家)开源混合推理模型,Hunyuan-A13B以其总参数80B、激活参数仅13B的精简设计,实现了与同等架构领先开源模型相媲美的效果,同时在推理速度上更胜一筹,性价比显著提升。这一创新不仅降低了开发者获取先进模型能力的门槛,更为AI应用的广泛普及奠定了坚实基础。
【AI日报速览】1.智谱推出免费AI Slides,基于GLM模型快速生成专业PPT;2.可灵AI发布可图2.1,图像生成支持180种风格;3.NVIDIA推出DiffusionRenderer,实现视频转3D场景编辑;4.墨刀AI上线30秒生成可编辑原型功能;5.Higgsfield Soul ID用10张照片生成虚拟形象;6.谷歌开源GenAI Processors构建AI工作流;7.谷歌Veo3新增图转视频功能;8.Mistral AI发布专注代码生成的Devstral2507系列模型。