魔搭社区与 vLLM 和 FastChat 合作,提供高效 LLM 推理和部署服务

站长之家
本文来自AIbase日报
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
微软已正式宣布,将于2025年8月11日终止其公共Bing Search API服务,包括Search v7和Custom Search在内的所有版本。此决定将影响从免费用户到付费用户的所有服务使用者。根据微软发布的退休通知,终止日期后,所有现有API资源将被禁用,同时新用户注册通道也将关闭。微软已在Bing Web Search API页面上发布了醒目横幅,提醒用户注意这一截止日期,并强调新部署已不再可用。作为替代方案,微软推荐开发者转向Azure AI Agent Service中的"Grounding with Bing Search"功能。该功能专为AI智能体提供实时网络数据,
Gemini API推出隐式缓存(Implicit Caching)功能,为开发者带来显著的成本优化体验。新功能无需开发者手动创建缓存,当请求与先前请求共享共同前缀时,系统将自动触发缓存命中,提供高达75%的Token折扣。此更新已覆盖Gemini2.5Pro和2.5Flash模型,进一步提升了AI开发的成本效益。官方详情可参考:https://developers.googleblog.com核心机制:自动缓存与动态折扣隐式缓存功能通过识别请求中的共同前缀,自动复用先前处理过的上下文数据,减少重复计算的Token消耗。例如,开发者在构建聊天机器人或代码分
近日,小红书正式推出了名为 NoteLLM 的多模态大型语言模型框架,旨在为用户提供更精准的笔记推荐服务。这个框架不仅能够理解文本信息,还能有效处理图像,借助其强大的语义理解能力,大幅提升了笔记推荐的准确性与相关性。NoteLLM 的核心技术在于生成笔记的压缩嵌入与自动生成标签的能力。通过引入对比学习与指令微调技术,该框架可以更好地解析用户行为数据,从而为每个笔记生成合适的标签和类别。这一创新的功能不仅优化了用户在平台上的使用体验,也极大地增强了用户与
近日,Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview(I/O 版)。这一升级版是在即将召开的 Google I/O2025开发者大会前发布的,标志着公司在 AI 领域的持续创新。根据 Google 的说法,Gemini2.5Pro Preview 在多项广泛使用的基准测试中表现优异,力求在激烈的市场竞争中占据一席之地。Gemini2.5Pro Preview 可以通过 Gemini API 以及 Google 的 Vertex AI 和 AI Studio 平台获取,价格与之前的 Gemini2.5Pro 模型相同。此外,它也将融入 Google 的 Gemini 聊天机器人应用中,适用于网页和移动设备。此次发布的时机恰
在全球安全大会(RSAC2025)上,Cisco 和 Meta 联手发布了 Foundation-sec-8B,这是一个专为网络安全设计的开源大型语言模型(LLM)。随着网络攻击的加剧,传统的防御措施已显不足,企业亟需创新的解决方案来应对不断演变的威胁。Foundation-sec-8B LLM 的独特之处Cisco 的 Foundation-sec-8B LLM 是由其新成立的 Foundation AI 团队开发的,旨在为网络安全领域提供专门的 AI 基础设施。该模型基于 Meta 的 Llama3.1架构,拥有80亿个参数,专门针对网络安全任务进行优化。与通用模型不同,Foundation-sec-8B 在训练过程中使
在刚刚结束的首届 LlamaCon AI 开发者大会上,Meta 公司正式发布了其 Llama 系列 AI 模型的 API,名为 Llama API。该 API 目前处于有限预览阶段,旨在让开发者能够探索和试验基于不同 Llama 模型的产品。Meta 表示,这一新工具将与公司的 SDK 配合使用,允许开发者创建由 Llama 模型驱动的服务、工具和应用程序。虽然 Meta 尚未透露 Llama API 的定价,但这项发布正值 Meta 在激烈的开放模型竞争中力求保持领先地位的背景下。Meta 目前声称,Llama 模型的下载量已超过10亿次。然而,行业内如 DeepSeek 和阿里巴
在人工智能领域,Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。这个数字在不久前的3月中旬刚刚达到10亿次,显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。在首届 LlamaCon 开发者大会上,Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。他表示,Llama 模型的成功离不开众多开发者的贡献,当前已经有数千名开发者在为这一生态系统贡献出数万个衍生模型。这一系列模型的每月下载量更是达到了数十万次,这
近日,字节跳动宣布推出其全新的数据选择框架 QuaDMix,旨在提升大型语言模型(LLM)预训练的效率和泛化能力。众所周知,模型的训练效果受基础数据集的质量和多样性影响很大。然而,传统的数据筛选方法往往将质量和多样性视为两个独立的目标,先进行质量过滤,再进行领域平衡。这种逐步优化的方式忽略了质量与多样性之间的复杂相互关系。优质数据集往往存在领域偏差,而多样化的数据集可能会降低质量。因此,在固定的训练预算下,如何同时优化这两个维度以最大化模型性能
蚂蚁集团旗下分布式数据库OceanBase今日宣布了一项重大人才和组织体系升级,旨在全力保障公司AI战略的高效落地。OceanBase CEO杨冰在全员信中透露了这一决定。根据全员信内容,OceanBase CTO杨传辉将担任公司AI战略的“一号位”,全面统筹AI战略的制定以及相关技术和产品的落地实施。为强化AI能力建设,OceanBase成立了全新的AI平台与应用部,由杨传辉兼任负责人(Acting)。该部门整合了原有的ODC和OAS团队,并迎来蔡飞志、王赫的加入。其核心任务是全力推进“DATAxAI”平台的搭建与应用开发
网络安全研究人员发出警告,一种名为“Slopsquatting”的新型软件供应链攻击正浮出水面。该攻击利用生成式 AI(如 LLMs)在代码编写时可能产生的“包幻觉”——即推荐不存在的软件包名称——的漏洞。攻击者可以抢先注册这些虚构的名称,并植入恶意代码。图源备注:图片由AI生成,图片授权服务商Midjourney研究团队发现,AI 虚构的软件包名称往往具有高度可信性和重复性,约38% 的幻觉包名与真实包名相似,仅13% 是简单拼写错误,这使得开发者在不加验证的情况下更容易直接采用。通过对