ComfyUI:强大的稳定扩散工作流可视化界面

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
华人团队研究发现,扩散语言模型在Token受限时展现出比自回归模型高三倍的数据学习能力。研究采用10亿参数模型,经480周期训练后,在HellaSwag和MMLU测试中分别达到56%和33%准确率。关键发现包括:1)扩散模型通过双向建模和更高计算密度实现更优性能;2)模型对数据重复使用具有鲁棒性,过拟合时性能仍可能提升。该研究为Token受限场景下的模型训练提供了新思路,团队计划用更大模型进一步验证。
Salesforce与南加州大学联合开发了CoAct-1混合AI系统,通过结合代码执行和GUI操作的优势提升任务自动化能力。该系统采用三代理协作架构:编排器分解任务,程序员处理代码操作,GUI操作员执行界面交互。测试显示其成功率高达60.76%,平均仅需10.15步完成复杂任务,显著优于纯GUI代理。该系统特别适合企业级应用场景,如客户支持和营销自动化,但需解决安全性、遗留系统兼容性等挑战,短期内仍需人工监督确保可靠性。
英伟达在SIGGRAPH大会上发布开源物理AI模型Cosmos Reason,该70亿参数模型显著提升机器人视觉推理能力,能像人类一样处理复杂多步骤任务。演示中机器人成功完成"面包+烤面包机"的合理操作推理。该技术已应用于优步自动驾驶数据标注、麦格纳配送方案等多个商业场景。英伟达同时更新了Omniverse工具包和神经重建库,推动AI与机器人技术深度融合。
智元机器人宣布与富临精工达成数千万元合作,近百台远征A2-W轮式通用机器人将进驻工厂,实现国内首个工业具身机器人规模化商业部署。这是该品类在全球智能制造场景的首次大规模落地,可完成拆垛、搬运等任务,标志着具身机器人从研发迈向实际应用新阶段。
Cursor 1.4版本发布,重点提升异步任务处理能力,优化大型代码库支持。新版本增强后台Agent功能,支持远程环境运行和GitHub仓库克隆,显著提升开发效率。针对大型项目改进代码索引和搜索,响应时间缩短100毫秒,新增多根工作区支持。强化AI自主性,支持Jupyter Notebook编辑,增强BugBot功能。优化团队协作,改进GitHub/Slack集成,新增上下文共享和Memories功能,实现更智能的自动化开发体验。
谷歌否认AI搜索功能扼杀网站流量,称有机点击量稳定且质量提升,与第三方报告显示的流量下降形成反差。谷歌承认用户转向论坛、视频等平台获取信息,并推出"优质点击"概念,强调AI概览能带来更有价值的访问。但数据显示新闻网站零点击率从56%升至69%。谷歌正帮助出版商通过非广告方式变现,强调搜索生态正在进化而非消亡。
销售自动化公司Clay完成1亿美元C轮融资,估值达31亿美元,由Alphabet旗下CapitalG领投。这家成立8年的企业专注AI销售工具,客户包括OpenAI、Canva等知名公司。今年营收预计达1亿美元,同比增长3倍。6个月内完成B轮和股权收购后,累计融资达2.04亿美元。其快速发展反映了市场对AI销售解决方案的强烈需求,也显示出投资者对B2B SaaS领域AI应用的持续看好。
AI编码初创公司Cognition收购Windsurf三周后裁员30人,并向剩余200名员工提供买断合同,与其"引进世界级人才"的承诺相悖。Windsurf此前经历多次动荡,包括险些被OpenAI收购、核心团队被谷歌挖角。Cognition收购时承诺保留所有员工,但最新举措显示其真正目标可能是知识产权而非团队。留下的员工面临每周80+小时、6天办公室的严苛工作条件,CEO明确表示不认同"工作生活平衡"理念。这揭示了AI行业为保持竞争优势而推行的极端工作文化。
中东金融科技公司Alaan完成4800万美元A轮融资,由Peak XV Partners领投。该公司由前麦肯锡顾问杜拉萨米创办,致力于解决中东企业信用卡使用难题。尽管面临监管延迟,Alaan已成为中东首个集成Apple Pay的B2B平台,并率先应用AI技术优化财务流程。自2022年推出以来,平台已处理250万笔交易,服务1500个财务团队,节省150万小时人工,实现1000万美元盈利。新融资将用于沙特市场扩张和AI技术研发。
腾讯AI工具ima推出四项新功能:AI播客可将文档转为双人对话式音频讲解;一键导入文件夹保持原有层级;支持Xmind脑图导入;知识库内容可置顶便于查找。这些功能基于混元大模型,帮助用户高效管理知识,未来将持续更新优化。