AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

魔搭社区与 vLLM 和 FastChat 合作，提供高效 LLM 推理和部署服务

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Dec 29, 2023

最近，魔搭社区与 vLLM 和 FastChat 展开合作，联合为中国开发者提供更快更高效的 LLM 推理和部署服务。开发者可以使用 vLLM 作为 FastChat 中的推理引擎，提供高吞吐量的模型推理。FastChat 是一个开放平台，用于训练、服务和评估基于 LLM 的 ChatBot。vLLM 是一个由加州伯克利分校、斯坦福大学和加州大学圣迭戈分校的研究人员开发的 LLM 服务系统。通过 FastChat 和 vLLM，开发者可以快速加载魔搭的模型进行推理。

LLM 推理引擎开发者

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

微软终止Bing Search API:开发者需在2025年前寻找替代方案

微软已正式宣布，将于2025年8月11日终止其公共Bing Search API服务，包括Search v7和Custom Search在内的所有版本。此决定将影响从免费用户到付费用户的所有服务使用者。根据微软发布的退休通知，终止日期后，所有现有API资源将被禁用，同时新用户注册通道也将关闭。微软已在Bing Web Search API页面上发布了醒目横幅，提醒用户注意这一截止日期，并强调新部署已不再可用。作为替代方案，微软推荐开发者转向Azure AI Agent Service中的"Grounding with Bing Search"功能。该功能专为AI智能体提供实时网络数据，

2025年5月13号 10:43

670

Gemini API推出隐式缓存功能，开发者成本降低75%

Gemini API推出隐式缓存（Implicit Caching）功能，为开发者带来显著的成本优化体验。新功能无需开发者手动创建缓存，当请求与先前请求共享共同前缀时，系统将自动触发缓存命中，提供高达75%的Token折扣。此更新已覆盖Gemini2.5Pro和2.5Flash模型，进一步提升了AI开发的成本效益。官方详情可参考:https://developers.googleblog.com核心机制:自动缓存与动态折扣隐式缓存功能通过识别请求中的共同前缀，自动复用先前处理过的上下文数据，减少重复计算的Token消耗。例如，开发者在构建聊天机器人或代码分

2025年5月9号 15:46

1.8k

小红书推出多模态笔记推荐框架 NoteLLM，提升用户体验！

近日，小红书正式推出了名为 NoteLLM 的多模态大型语言模型框架，旨在为用户提供更精准的笔记推荐服务。这个框架不仅能够理解文本信息，还能有效处理图像，借助其强大的语义理解能力，大幅提升了笔记推荐的准确性与相关性。NoteLLM 的核心技术在于生成笔记的压缩嵌入与自动生成标签的能力。通过引入对比学习与指令微调技术，该框架可以更好地解析用户行为数据，从而为每个笔记生成合适的标签和类别。这一创新的功能不仅优化了用户在平台上的使用体验，也极大地增强了用户与

2025年5月7号 17:19

3.9k

Google 发布升级版 Gemini 2.5 Pro AI 模型助力开发者提升编码能力

近日，Google 宣布推出其最新的 AI 模型 ——Gemini2.5Pro Preview（I/O 版）。这一升级版是在即将召开的 Google I/O2025开发者大会前发布的，标志着公司在 AI 领域的持续创新。根据 Google 的说法，Gemini2.5Pro Preview 在多项广泛使用的基准测试中表现优异，力求在激烈的市场竞争中占据一席之地。Gemini2.5Pro Preview 可以通过 Gemini API 以及 Google 的 Vertex AI 和 AI Studio 平台获取，价格与之前的 Gemini2.5Pro 模型相同。此外，它也将融入 Google 的 Gemini 聊天机器人应用中，适用于网页和移动设备。此次发布的时机恰

2025年5月7号 8:53

2.9k

应对网络威胁利器！Cisco与Meta推出Foundation-sec-8B LLM

在全球安全大会（RSAC2025）上，Cisco 和 Meta 联手发布了 Foundation-sec-8B，这是一个专为网络安全设计的开源大型语言模型(LLM)。随着网络攻击的加剧，传统的防御措施已显不足，企业亟需创新的解决方案来应对不断演变的威胁。Foundation-sec-8B LLM 的独特之处Cisco 的 Foundation-sec-8B LLM 是由其新成立的 Foundation AI 团队开发的，旨在为网络安全领域提供专门的 AI 基础设施。该模型基于 Meta 的 Llama3.1架构，拥有80亿个参数，专门针对网络安全任务进行优化。与通用模型不同，Foundation-sec-8B 在训练过程中使

2025年5月6号 9:28

3.7k

Meta 发布 Llama API，开发者可体验最新 AI 模型

在刚刚结束的首届 LlamaCon AI 开发者大会上，Meta 公司正式发布了其 Llama 系列 AI 模型的 API，名为 Llama API。该 API 目前处于有限预览阶段，旨在让开发者能够探索和试验基于不同 Llama 模型的产品。Meta 表示，这一新工具将与公司的 SDK 配合使用，允许开发者创建由 Llama 模型驱动的服务、工具和应用程序。虽然 Meta 尚未透露 Llama API 的定价，但这项发布正值 Meta 在激烈的开放模型竞争中力求保持领先地位的背景下。Meta 目前声称，Llama 模型的下载量已超过10亿次。然而，行业内如 DeepSeek 和阿里巴

2025年4月30号 10:02

2.3k

Meta Llama AI模型下载量突破12亿，开发者热情高涨

在人工智能领域，Meta 公司近期传来了一个令人振奋的消息:其 “开放式” AI 模型系列 Llama 的下载量已突破12亿次。这个数字在不久前的3月中旬刚刚达到10亿次，显示出 Llama 模型在开发者和用户中获得的广泛认可和热情。在首届 LlamaCon 开发者大会上，Meta 的首席产品官 Chris Cox 在主题演讲中透露了这一令人瞩目的数据。他表示，Llama 模型的成功离不开众多开发者的贡献，当前已经有数千名开发者在为这一生态系统贡献出数万个衍生模型。这一系列模型的每月下载量更是达到了数十万次，这

2025年4月30号 9:04

1.2k

字节跳动推出 QuaDMix：大型语言模型预训练数据质量与多样性的统一框架

近日，字节跳动宣布推出其全新的数据选择框架 QuaDMix，旨在提升大型语言模型（LLM）预训练的效率和泛化能力。众所周知，模型的训练效果受基础数据集的质量和多样性影响很大。然而，传统的数据筛选方法往往将质量和多样性视为两个独立的目标，先进行质量过滤，再进行领域平衡。这种逐步优化的方式忽略了质量与多样性之间的复杂相互关系。优质数据集往往存在领域偏差，而多样化的数据集可能会降低质量。因此，在固定的训练预算下，如何同时优化这两个维度以最大化模型性能

2025年4月28号 9:38

3.6k

蚂蚁OceanBase 发布全员信：CTO杨传辉担任AI一号位瞄准AI数据底座

蚂蚁集团旗下分布式数据库OceanBase今日宣布了一项重大人才和组织体系升级，旨在全力保障公司AI战略的高效落地。OceanBase CEO杨冰在全员信中透露了这一决定。根据全员信内容，OceanBase CTO杨传辉将担任公司AI战略的“一号位”，全面统筹AI战略的制定以及相关技术和产品的落地实施。为强化AI能力建设，OceanBase成立了全新的AI平台与应用部，由杨传辉兼任负责人（Acting）。该部门整合了原有的ODC和OAS团队，并迎来蔡飞志、王赫的加入。其核心任务是全力推进“DATAxAI”平台的搭建与应用开发

2025年4月27号 14:29

8.0k

开发者注意!AI 推荐软件包五分之一是假的，“Slopsquatting”威胁来袭

网络安全研究人员发出警告，一种名为“Slopsquatting”的新型软件供应链攻击正浮出水面。该攻击利用生成式 AI（如 LLMs）在代码编写时可能产生的“包幻觉”——即推荐不存在的软件包名称——的漏洞。攻击者可以抢先注册这些虚构的名称，并植入恶意代码。图源备注:图片由AI生成，图片授权服务商Midjourney研究团队发现，AI 虚构的软件包名称往往具有高度可信性和重复性，约38% 的幻觉包名与真实包名相似，仅13% 是简单拼写错误，这使得开发者在不加验证的情况下更容易直接采用。通过对

2025年4月27号 10:09

4.9k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图

魔搭社区与 vLLM 和 FastChat 合作，提供高效 LLM 推理和部署服务

站长之家

本文来自AIbase日报

相关AI新闻推荐

微软终止Bing Search API:开发者需在2025年前寻找替代方案

Gemini API推出隐式缓存功能，开发者成本降低75%

小红书推出多模态笔记推荐框架 NoteLLM，提升用户体验！

Google 发布升级版 Gemini 2.5 Pro AI 模型 助力开发者提升编码能力

​应对网络威胁利器！Cisco与Meta推出Foundation-sec-8B LLM

​Meta 发布 Llama API，开发者可体验最新 AI 模型