AI新闻资讯

AI资讯

不错过全球AI革新的每一个时刻

AI日报

每天三分钟关注AI行业趋势

AI时间线

AI行业大事记

Al硬件

列出所有AI硬件产品。

AI变现指南

图片合集

AI图片制作变现案例分享

视频合集

AI视频制作变现案例分享

音频合集

AI音频制作变现案例分享

文案合集

AI内容写作变现案例分享

AI教程

AI产品榜

AI产品排行榜

展示AI网站的总访问量排名

AI产品流量增速榜

追踪AI网站访问量增长最快产品

AI产品流量下降榜

关注访问量下降明显的AI网站

AI产品周榜

展示AI网站的周访问量排名

AI开源项目库

全景图

github热门AI开源项目总览

产品库工具导航

谷歌DeepMind 2023年AI技术进展总结

新智元

发布于AI新闻资讯 · 1 分钟阅读 · Dec 25, 2023

文章总结了2023年谷歌在AI技术与产品方面的最新进展。包括发布语言模型PaLM 2、多模态系统Gemini,以及在气候预测、医疗检测、量子计算等多个领域取得重要突破。此外,谷歌还推出了AI安全基准测试,与业内重要机构展开合作。展望未来,谷歌AI研究仍在持续推进,预计会在更多领域实现技术革新。

深度学习模型多模态自然语言处理

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作

解锁笔记新维度：AI多模态技术让Obsidian图像管理效率暴增

在数字笔记的世界里，文字一直是主角，而图像却常常被冷落在角落。作为一名AI方向研究生兼Obsidian重度用户，我深知这种不平衡的痛点。当我们谈论知识管理时，往往只关注文本处理，却忽略了图像这一同样重要的信息载体。如今，随着计算机视觉技术的飞速发展，我们终于有能力打破这道藩篱，将图像无缝融入知识管理系统。经过数周的探索实践，我发现了几种强大的AI工具和方法，可以彻底改变你在Obsidian中处理图像的方式。图像:知识管理中的"隐形人"计算机技术诞生以来，文本一

2025年5月8号 14:59

670

小红书推出多模态笔记推荐框架 NoteLLM，提升用户体验！

近日，小红书正式推出了名为 NoteLLM 的多模态大型语言模型框架，旨在为用户提供更精准的笔记推荐服务。这个框架不仅能够理解文本信息，还能有效处理图像，借助其强大的语义理解能力，大幅提升了笔记推荐的准确性与相关性。NoteLLM 的核心技术在于生成笔记的压缩嵌入与自动生成标签的能力。通过引入对比学习与指令微调技术，该框架可以更好地解析用户行为数据，从而为每个笔记生成合适的标签和类别。这一创新的功能不仅优化了用户在平台上的使用体验，也极大地增强了用户与

2025年5月7号 17:19

3.1k

消息称通义视觉负责人薄列峰离职或加入某大厂新组建多模态团队

据多方信源透露，阿里巴巴通义实验室应用视觉团队负责人薄列峰（职级P10）已于2024年4月30日正式离职，并低调加盟某头部互联网公司，出任新设立的多模态模型部副总经理一职。尽管该互联网公司具体名称尚未公开，坊间普遍猜测其去向可能是字节跳动或腾讯，但目前相关公司及本人均未作出回应，尚无法证实具体归属。图源备注:图片由AI生成，图片授权服务商Midjourney此次人事变动引发业界关注的另一焦点在于“竞业限制”。爆料称，薄列峰目前常驻美国西雅图，因而不会受到中国大

2025年5月7号 14:28

1.7k

百度网推出多模态 AI 笔记，学习效率提高 10 倍

在现代快节奏的生活中，学习的方式正在发生革命性的变化。5月2日，百度网盘联合百度文库推出了一款名为 “AI 笔记” 的新功能，旨在提升用户在视频学习时的效率，宣称可使学习效率提升达10倍。这个功能的推出，完美解决了用户在学习过程中频繁切换平台的繁琐操作。过去，用户在观看学习视频时，往往需要不断地暂停、截屏、记录笔记、插图以及批注。这一系列的操作不仅耗时耗力，还容易导致学习的断层和效率低下。为了应对这一挑战，百度网盘的 “AI 笔记” 功能提供了全自

2025年5月3号 10:00

26.9k

阿里开源多模态模型Qwen2.5-Omni：显存大幅降低暴降 50%

在开源大模型的竞争中，阿里巴巴推出了其最新的多模态模型 Qwen2.5-Omni-3B。这款模型的显著特点是显存使用减少了50%，在同等处理能力下，更加适合普通消费者的 GPU 设备。这一创新标志着阿里在多模态人工智能领域的进一步突破。Qwen2.5-Omni 是一款端到端的多模态模型，能够同时处理文本、图像、音频和视频等多种信息类型。得益于其独特的 “Thinker-Talker” 架构，模型能够在实时互动中灵活运用多种输入，生成相应的文本和自然语音回应。这种设计使得用户在与系统的互动中，能够获得

2025年5月1号 9:45

46.3k

AI日报：国内首个多模态AI程序员上岗；字节启动Top Seed计划招募AI人才；DeepSeek R1T Chimera上线OpenRouter

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、国内首个多模态AI程序员正式上岗文心快码Coding智能体Zulu正式发布在2025年4月25日的百度Create AI开发者大会上，百度推出了文心快码3.5版本及其多模态AI程序员文心快码Comate Zulu智能体，标志着AI编程工具的新纪元。Zulu智能体通过高效的多模态交互，能够自动生成代码并支持多种开发环境，极大

2025年4月28号 15:34

7.7k

国内首个多模态AI程序员正式上岗文心快码Coding智能体Zulu正式发布

百度Create AI开发者大会在北京隆重举行。在这场备受瞩目的科技盛会中，百度正式发布了文心快码3.5版本以及国内首个多模态AI程序员——文心快码Comate Zulu智能体，标志着AI编程工具进入了一个全新的发展阶段。

2025年4月28号 10:18

2.5k

智谱与生数科技达成战略合作专注大模型联合创新

4月27日，清华大学旗下的两家明星人工智能公司智谱（Z.ai）和生数科技(shengshu.com)宣布达成重大战略合作。此次合作旨在通过双方在大语言模型和多模态生成模型的技术积累与优势，共同推进国产大模型的技术创新与产业落地。

2025年4月27号 14:09

6.0k

芯驰发布新一代4纳米 AI 座舱芯片 X10，提升智能驾驶体验

在2025上海车展上，芯驰科技正式推出了最新研发的 AI 座舱芯片 ——X10。这款芯片采用了先进的4纳米制程工艺，具备强大的计算能力，能够支持7B 参数的多模态大模型在端侧的本地部署。这标志着芯驰科技在智能座舱芯片领域的一次重大突破，预计将大幅提升智能驾驶体验。从技术规格来看，X10芯片配备了200K DMIPS 算力的 Arm v9.2架构 CPU，搭载1.8TFLOPS 算力的 GPU 以及40TOPS 算力的 NPU，确保其在处理复杂计算任务时具备极高的效率。该芯片还支持128bit 位宽的9600MT/s LPDDR5x 内存，系统内存带宽达

2025年4月27号 9:57

1.1k

Moonshot AI发布Kimi-Audio：开源音频基础模型树立新标杆

近日，Moonshot AI正式宣布推出Kimi-Audio，一款全新的开源音频基础模型，旨在推动音频理解、生成和交互领域的技术进步。这一发布引发了全球AI社区的广泛关注，被认为是多模态AI发展的重要里程碑。以下是对Kimi-Audio核心特性、性能表现及行业影响的全面报道。突破性特性:全能音频处理能力Kimi-Audio-7B-Instruct基于Qwen2.5-7B架构，并结合Whisper技术，展现了强大的多功能性。该模型支持多种音频相关任务，包括但不限于:语音识别（ASR）、音频问答(AQA)、音频字幕(AAC)、语音情感识别(SER)、声音事件

2025年4月27号 9:04

4.5k

AI资讯

AI日报

AI时间线

Al硬件

最新案例

图片合集

视频合集

音频合集

文案合集

最新教程

AI产品排行榜

AI产品流量增速榜

AI产品流量下降榜

AI产品周榜

美国

中国

印度

巴西

图片生成

个人助理

角色生成网站

视频生成

AI项目榜单

AI项目增速榜

AI开发者排名

AI组织排名

deepseek

TTS

LLM

ChatGPT

全景图