Adept Fuyu-Heavy:数字代理新利器,多模态模型崭露头角

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
苹果正研发轻便智能眼镜,采用双界面设计,可能运行visionOS系统,界面会根据配对设备调整。这印证了资源从Vision Pro转向更便携产品的传闻。
Meta成立超级智能实验室,其首篇论文《REFRAG:Rethinking RAG based Decoding》提出新方法,显著提升大语言模型在检索增强生成任务中的推理速度,提升幅度达30倍以上,同时保持准确性不变。
苹果iOS26.1开发者预览版Beta3发布,带来音频录制功能升级,支持外接麦克风时直接调整增益电平和自定义存储位置,并优化第三方智能手表兼容性。
凯发电气拟定向增发募资3亿元,用于供电自动化产品技术升级与产业化,以及轨道交通供电大模型研发平台建设,以推动城市轨道交通供电系统智能化、自动化发展。
甲骨文CEO Clay Magouyrk在AI大会上表示,对OpenAI发展充满信心,认为其能承担每年高达600亿美元的云基础设施费用。他指出OpenAI用户增速惊人,已接近10亿,行业罕见。
微软推出首款自研文本转图像生成器MAI-Image-1,标志着其AI发展新阶段。该模型通过吸收创意专业人士意见,有效避免重复和风格化问题,在生成照片级真实图像方面表现优异,尤其擅长处理闪电、风景等复杂场景。
微软推出首款自研图像生成模型MAI-Image-1,该模型已进入LMArena文本到图像榜单前十。微软强调注重实际应用价值,通过严格数据筛选和评估机制避免生成重复或单一风格图像,为创作者提供更强大灵活的工具支持。
蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer,显著提升推理速度。基准测试显示,其比英伟达Fast-dLLM快10.7倍,在HumanEval代码生成任务中单次推理达每秒1011个Tokens,推动技术迈向实际应用。
Meta挖角思维机器实验室联合创始人安德鲁・图洛克,引发业界关注。图洛克与米拉・穆拉提共同创立该实验室,穆拉提前因离开OpenAI受瞩目。此次变动对实验室造成影响,凸显Meta创始人扎克伯格对AI领域的持续投入。
硅基流动平台上线阿里Qwen3-VL开源模型,该模型在视觉理解、时序分析和多模态推理方面显著进步。它能有效应对图像模糊、视频复杂等难题,提升视觉认知能力,支持32种语言OCR功能,准确处理弱视觉信息,帮助用户轻松处理复杂视觉任务。