RPG-DiffusionMaster:LLM优化SD文本到图像的框架
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI21Labs CEO澄清与英伟达交易传闻,称双方未达成具体协议。公司虽与包括英伟达在内的多方洽谈合作,但讨论仍在进行中。此前媒体曾报道其估值达20-30亿美元。
小米宣布将自研大模型MiMo-V2-Flash的公测限免期延长20天,至2026年1月20日。该模型参数量达3090亿,激活参数150亿,在推理和代码生成方面表现优异。此举旨在为用户提供更长的体验时间,并展现小米在AI领域的持续投入与信心。
MiniMax开源M2.1编程模型,已在Hugging Face、ModelScope和GitHub上线,方便开发者接入。该模型获vLLM“Day-0”支持,可立即实现高效推理,并通过KTransformers技术优化性能。
乐享科技发布全新具身智能品牌“元点智能”,并推出首款全尺寸人形机器人原型,正式进军通用机器人领域。品牌已构建覆盖户外、家庭等场景的产品矩阵,包括履带式户外机器人W1等,致力于打造全场景智能机器人解决方案。

YuanLab.ai发布开源多模态大模型Yuan3.0Flash,参数规模达40B,采用稀疏混合专家架构,推理时仅激活约3.7B参数,显著提升效率。模型提供16bit与4bit权重、技术报告及训练方法,支持二次开发和行业定制,推动AI技术普及。
谷歌被指控未经用户同意,利用Google Photos中的照片为其AI系统提供数据,涉及全球15亿用户隐私。这一指控来自竞争对手Proton,而非监管机构,引发对照片分析与存储的新担忧。

罗永浩创业公司“细红线”发布AI产品“且听”,定位为深度语音听库。该产品运用自然语言处理与知识图谱技术,对书籍进行结构化拆解,提供长达1-2小时、字数过万的“深度精讲”,提炼书籍核心内容。

SuperCLUE-VLM最新榜单显示,谷歌Gemini-3-Pro以83.64分大幅领先,在视觉理解与推理方面优势明显。国产模型表现突出,商汤SenseNova V6.5Pro和字节豆包分列第二、三位,展现中国AI在多模态领域的快速进步。评测涵盖三大核心能力维度。
苹果在AI领域采取保守策略,或成其2026年被低估的竞争优势。自2024年WWDC宣布AI愿景后,苹果交付进度放缓,转而以UI革新为主打,而竞争对手在AI基础设施上持续发力。
SuperCLUE-VLM多模态测评显示,谷歌Gemini-3-pro以83.64分夺冠,在基础认知、视觉推理和应用三大维度全面领先。国产模型表现亦受关注。