信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

工具

GEO品牌监控分析

分析并追踪人工智能模型如何引用您的品牌

GEO排名查询工具

检测品牌在AI平台中的可见度

服务

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

SALMONN框架：拓展大型语言模型通用听觉能力

站长之家

发布于AI新闻资讯 · 1 分钟阅读 · Nov 29, 2023

111

SALMONN框架通过整合不同听觉编码器和激活调整阶段，取得了竞争性的通用听觉性能。其多模态架构为大型语言模型提供了直接理解和处理通用音频输入的能力，展示了在多种任务中的竞争性性能。

SALMONN LLM 多模态

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

英伟达推LLM微调“新手友好指南”！集成Unsloth框架，RTX笔记本性能提升2.5倍，本地微调门槛大幅降低

英伟达发布大模型微调指南，降低技术门槛，让普通开发者也能在消费级设备上高效完成模型定制。该指南详解如何在NVIDIA全系硬件上利用开源框架Unsloth实现专业级微调。Unsloth专为NVIDIA GPU打造，优化训练全流程，提升性能。

2025年12月26号 9:43

230

声智科技推全球首款“多模态AI时尚耳机”！声视融合，Kickstarter首发开启随身感知新时代

声智科技推出全球首款多模态AI时尚耳机，融合视觉与声学交互，突破传统耳机局限。该产品定位为“随身感知工具”，通过声视融合技术实现“看得见、听得清、回得准”，即将在Kickstarter全球首发。

2025年12月25号 11:11

270

中兴押注AI手机！携手字节推“豆包手机”，开放生态或迎多模型共存时代

中兴与字节跳动合作推出“豆包手机”，瞄准AI手机未来。双方基于“开放即创新”理念，共同布局AI赛道。中兴表示，这只是起点，已收到多家大模型厂商合作邀约，正构建多元AI生态。

2025年12月24号 17:51

200

Jan团队发布Jan-v2-VL-Max！30B多模态模型专攻长周期Agent任务，长序列执行稳超Gemini 2.5 Pro

Jan团队发布300亿参数多模态大模型Jan-v2-VL-Max，专为长周期、高稳定性自动化任务设计，性能超越谷歌Gemini2.5Pro与DeepSeek R1。该模型重点解决多步任务中的“误差累积”和“失焦”问题，为开源智能体生态提供强大支持。

2025年12月24号 14:25

440

长跑型 AI 登场：Jan 团队发布 Jan-v2-VL，深度优化多步任务执行力

Jan团队推出30B参数多模态模型Jan-v2-VL-Max，专注解决AI在复杂自动化任务中易中断的痛点。该模型基于Qwen3-VL-30B-A3B-Thinking，引入LoRA-based RLVR技术，旨在提升多步操作的稳定性，实现更可靠的长周期任务执行。

2025年12月24号 11:20

320

多智能体可信标准在ITU立项：信通院、蚂蚁、中国电信等共同推动

近日，国际电信联盟会议通过由蚂蚁集团等单位提出的《终端多智能体系统可信要求》国际标准项目。该标准聚焦可信连接、身份、意图等核心要素，旨在推动终端智能体生态的共建与可信发展。

2025年12月22号 12:23

Agent成AI新核心！火山引擎推AgentKit，谭待：未来计算单元将从App转向智能体

大模型竞赛进入“落地攻坚”阶段，火山引擎提出AI演进新范式：智能Agent成为AI落地核心载体，多模态能力与高效开发体系是关键。大模型正从问答交互转向深入汽车、制造等复杂场景，实现从“聊天”到“干活”的跨越。

2025年12月22号 9:11

290

苹果发布全新多模态 AI 模型 UniGen 1.5，实现图像理解、生成与编辑三合一

苹果推出多模态AI模型UniGen1.5，整合图像理解、生成与编辑三大功能于统一框架，显著提升效率。该模型利用图像理解能力优化生成效果，实现技术突破。

2025年12月19号 9:26

320

Meta发布SAM Audio：全球首个支持“点击分离声音”的多模态音频模型，一键提取吉他声、人声或狗叫

Meta发布SAM Audio，全球首个统一多模态音频分离模型。用户可通过点击视频中物体、输入关键词或圈定时间片段，一键提取目标声音或过滤噪音，实现“用眼睛听声音”。该技术首次模拟人类自然感知声音的方式，支持看、说等多种交互。

2025年12月18号 9:25

810

美的医疗发布国产医学影像大模型：胸部DR病种“一键诊断”，双量级架构兼顾端云部署

美的集团旗下美的医疗推出自主知识产权“医学影像多模态智能诊断大模型”，实现AI医疗关键突破。该模型可一次性自动检测肺结核、肺炎、气胸、骨折等常见胸部疾病，并生成结构化诊断报告，显著提升基层医疗机构阅片效率与诊断一致性。

2025年12月17号 16:55

480

AI新闻资讯

最新AI日报

AI 商用·开源产品库

AI 产品排行榜

AI产品提交

AI工具导航

模型库

大模型排行榜

模型供应商

大模型选型对比

大模型费用计算器

大模型竞技场

MCP服务端

MCP客户端

MCP教程与实践

MCP排行榜

MCP服务提交

MCP实验场

MCP服务调试器

GEO品牌监控分析

GEO排名查询工具

GEO 大模型推荐优化

模型个人电脑配置检测器

模型部署服务器配置计算器

SALMONN框架：拓展大型语言模型通用听觉能力

站长之家

本文来自AIbase日报

相关AI新闻推荐

英伟达推LLM微调“新手友好指南”！集成Unsloth框架，RTX笔记本性能提升2.5倍，本地微调门槛大幅降低

声智科技推全球首款“多模态AI时尚耳机”！声视融合，Kickstarter首发开启随身感知新时代

中兴押注AI手机！携手字节推“豆包手机”，开放生态或迎多模型共存时代

Jan团队发布Jan-v2-VL-Max！30B多模态模型专攻长周期Agent任务，长序列执行稳超Gemini 2.5 Pro

​长跑型 AI 登场：Jan 团队发布 Jan-v2-VL，深度优化多步任务执行力

多智能体可信标准在ITU立项：信通院、蚂蚁、中国电信等共同推动

Agent成AI新核心！火山引擎推AgentKit，谭待：未来计算单元将从App转向智能体

苹果发布全新多模态 AI 模型 UniGen 1.5，实现图像理解、生成与编辑三合一

Meta发布SAM Audio：全球首个支持“点击分离声音”的多模态音频模型，一键提取吉他声、人声或狗叫

美的医疗发布国产医学影像大模型：胸部DR病种“一键诊断”，双量级架构兼顾端云部署

相关AI新闻推荐

英伟达推LLM微调“新手友好指南”！集成Unsloth框架，RTX笔记本性能提升2.5倍，本地微调门槛大幅降低

声智科技推全球首款“多模态AI时尚耳机”！声视融合，Kickstarter首发开启随身感知新时代

中兴押注AI手机！携手字节推“豆包手机”，开放生态或迎多模型共存时代

Jan团队发布Jan-v2-VL-Max！30B多模态模型专攻长周期Agent任务，长序列执行稳超Gemini 2.5 Pro

​长跑型 AI 登场：Jan 团队发布 Jan-v2-VL，深度优化多步任务执行力

多智能体可信标准在ITU立项：信通院、蚂蚁、中国电信等共同推动

Agent成AI新核心！火山引擎推AgentKit，谭待：未来计算单元将从App转向智能体

苹果发布全新多模态 AI 模型 UniGen 1.5，实现图像理解、生成与编辑三合一

Meta发布SAM Audio：全球首个支持“点击分离声音”的多模态音频模型，一键提取吉他声、人声或狗叫

美的医疗发布国产医学影像大模型：胸部DR病种“一键诊断”，双量级架构兼顾端云部署

长跑型 AI 登场：Jan 团队发布 Jan-v2-VL，深度优化多步任务执行力

长跑型 AI 登场：Jan 团队发布 Jan-v2-VL，深度优化多步任务执行力