亚马逊AWS推出按需GPU资源服务 Amazon EC2 Capacity Blocks
站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
亚马逊SageMaker AI推出新功能,支持OpenAI兼容API的实时推理端点。用户仅需修改端点URL,即可通过OpenAI SDK、LangChain等工具调用模型,无需额外定制或重写代码。新增的/openai/v1路径可处理聊天补全请求并返回响应,包括流式输出,兼容标准SageMaker AI API和SDK。

亚马逊创始人贝索斯认为,将数据中心搬至太空是“非常现实”的未来方向,但落地时间可能比预期更长。主要障碍包括高昂的能源成本和芯片价格需进一步降低,以释放预算空间。随着AI需求激增,全球航天企业正积极推动“轨道数据中心”概念,支持者看好其潜力。
英特尔数据中心GPU新品“Crescent Island”PCB高清谍照曝光。该产品专为AI推理优化,采用PCIe Gen5+金手指设计,中心有大型GPU核心焊盘,尾端配备12V-2x6供电接口,展示了其内部硬件布局。

亚马逊Alexa+推出“Alexa Podcasts”新功能,支持用户通过语音指令按需生成个性化播客。用户只需说出“帮我做个关于XX的播客”,无需上传资料或编写脚本,即可在几分钟内获得一期专属播客节目。该功能即日起面向美国用户开放测试,旨在将任何感兴趣的话题快速转化为播客内容。
英伟达CEO黄仁勋及其妻子通过家族基金会,从算力商CoreWeave购入价值1.083亿美元的计算资源,免费提供给大学和非营利机构,用于支持前沿科学实验和AI基础研究。此举结合了技术与资金的双重支持,英伟达公司也参与了相关承诺。
亚马逊推出全新“Alexa购物助手”,由Alexa+驱动,整合AI提升购物体验。支持语音及触控操作,覆盖手机、桌面和Echo Show设备,已在美国上线。与Rufus不同,该助手专注个性化推荐与自动化购物,涵盖亚马逊及其他在线零售商。
亚马逊旗下Ring因客服电话激增,在评估40多家AI语音供应商后,选择初创公司Vapi处理所有来电。此举提升了Ring的客服体验,同时助力Vapi获得500万美元B轮融资,估值达5亿美元。Vapi首席执行官称,其平台支持Ring工程师在实时互动中优化AI,成为胜出关键。

亚马逊员工利用内部AI工具“MeshClaw”将非必要任务分配给AI代理,以提升公司AI使用排行榜的个人分数。这种做法偏离了AI提升效率的初衷,可能影响整体工作效率和资源分配,引发外界对内部竞争机制负面效应的关注。

AMD发布vLLM-ATOM插件,专为大语言模型部署优化,在不改变现有工作流下,显著提升DeepSeek-R1、Kimi-K2等国产大模型在AMD硬件上的推理性能。该插件针对Instinct系列GPU定制,利用vLLM框架的高显存利用率优势,让开发者以低学习成本实现技术迁移,获得性能平滑升级。
马斯克诉奥尔特曼案中曝光的法庭文件显示,2017年微软CEO纳德拉与OpenAI CEO奥尔特曼已开始探讨AI合作。但微软高层对投资OpenAI态度复杂:既担心投入资金过大,又忧虑OpenAI可能转投竞争对手亚马逊并“说坏话”。