Groq是一家AI芯片创业公司,由谷歌前员工创立。该公司推出了一款名为LPU的AI加速芯片,通过技术创新大幅提速大模型的推理与生成,速度可达GPU的10倍。这主要得益于采用了高速的SRAM存储技术,以及减少内存访问的架构设计。用户可以在LPU上运行Llama、Mixtral等多种大模型。LPU的推出有助于进一步优化大模型性能,或用于提升语音助手、AI写作等应用的响应速度。
相关AI新闻推荐

「6月30日AI日报」百度开源文心大模型4.5系列;通义千问多模态生成模型Qwen VLo
欢迎来到AIbase【AI日报】栏目!每天三分钟了解当日AI大事件,助你洞悉AI行业趋势、创新AI产品应用。更多AI资讯访问:https://www.aibase.com/zh1.百度重磅开源文心大模型4.5系列,十款新模型亮相!百度正式发布文心大模型4.5系列并完全开源,包含多种参数配置的十款新模型,使用飞桨框架训练推理,FLOPs利用率47%,在文本多模态基准测试中表现优异,提供一站式使用指南和工具,方便开发者精调部署,已上传至Hugging Face、GitHub等平台。体验地址:https://yiyan.baidu.com Hugging Face:https://huggingface.co/baidu)Gi

欧洲首台百万兆次级超级计算机 JUPITER 启用
在气候变化和自然现象模拟的研究中,强大的计算能力至关重要。为此,位于德国的于利希超级计算中心(Jülich Supercomputing Center)近日推出了欧洲首台百万兆次级超级计算机 JUPITER(木星)。这台计算机的强大处理能力为科学研究带来了全新的可能性。图源备注:图片由AI生成,图片授权服务商MidjourneyJUPITER 于2025年6月首次亮相于全球最强大计算机系统的 TOP500排行榜上,位列第四。它拥有5900个加速计算节点,配备了约24000颗 Nvidia Grace-Hopper 超级芯片和1300个使用 Rhea1处理器的节点。此外,JUPIT

新开源 AI 系统 OmniGen 2:像GPT-4o 一样融合了图像和文本生成
近日,北京人工智能研究院推出了全新的开源系统 ——OmniGen2。这一系统专注于文本到图像的生成、图像编辑和上下文图像创作。与2024年发布的第一代 OmniGen 相比,OmniGen2采用了两条独立的解码路径:一条用于文本生成,另一条用于图像生成,且各自拥有独立的参数和解耦的图像标记器。这种设计让模型在保持文本生成能力的同时,有效地提升了多模态语言模型的表现。OmniGen2的核心是一个基于 Qwen2.5-VL-3B 变换器的大型多模态语言模型(MLLM)。在图像生成方面,该系统使用了一种自定义的扩

百度重磅开源文心大模型 4.5 系列,国内大模型市场再掀波澜!
近日,百度正式宣布开源其文心大模型4.5系列,共推出了十款模型,包括47B、3B 激活参数的混合专家(MoE)模型,以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开,还提供了推理代码,标志着百度在大模型领域的重大进展。这些新发布的模型可以在飞桨星河社区、Hugging Face 等平台上下载和部署,同时,百度智能云千帆大模型平台也提供了相应的 API 服务。这一举措使百度成为国内继腾讯、阿里、字节跳动之后,又一家积极参与开源的科技巨头,表明其在大模型应用

百度重磅开源文心大模型 4.5 系列,十款新模型亮相!
百度正式发布了文心大模型4.5系列模型,并且将其完全开源。用户可以通过文心一言(https://yiyan.baidu.com)立即体验这一最新的开源技术。 这一系列模型涵盖了多种参数配置,包括激活参数为47B 和3B 的混合专家(MoE)模型,以及稠密型模型0.3B 参数的设计,合计达到了十款不同的模型。在训练和推理方面,文心4.5系列模型使用了飞桨深度学习框架,达到47% 的模型 FLOPs 利用率。实验结果显示,该系列模型在多项文本和多模态基准测试中表现优异,尤其是在指令遵循、世界知识记忆、视觉理

Gemini2.5Pro API 免费回归,开发者社区热烈响应
近日,谷歌宣布其旗舰AI模型Gemini2.5Pro的API重新纳入Google AI Studio的免费层级,这一消息引发了开发者社区的广泛关注和热烈讨论。根据AIbase报道,这一举措标志着谷歌在AI技术普及化方面的又一重要进展,为开发者提供了更低门槛的创新机会。Gemini2.5Pro作为谷歌迄今为止最先进的AI模型,以其卓越的多模态能力和强大的推理性能而闻名。该模型支持高达100万token的上下文窗口,能够处理文本、图像、音频和视频等多种输入类型,在编码、复杂推理和数据分析等任务中表现尤为突出。此前,谷

百度文心系列大模型在飞桨平台开源,涵盖多款最新模型
百度旗下文心系列大模型近日已在其飞桨(PaddlePaddle)平台开源,其中包括 ERNIE-4.5-VL-424B-A47B-Paddle 和 ERNIE-4.5-300B-A47B-Paddle 等数十款最新模型。尽管百度方面尚未主动披露此次开源行动,但飞桨平台的更新信息显示,这一系列动作集中在6月29日至6月30日,是其最新的举措。有内部人士证实:“官网上新并公布了开源代码,足见公司确实已在推进开源举措。”此次开源,将使更多开发者和研究者能够利用百度文心系列大模型的强大能力,推动人工智能技术的发展和应用。

显存优化!英伟达 DLSS 4 让游戏更流畅,Transformer 模型显存减少 20%
在游戏性能日益提升的今天,英伟达再次引领了显卡技术的潮流。最新发布的 DLSS4SDK,不仅正式上线,还在显存(VRAM)的使用上进行了重大优化,让玩家们在享受高质量游戏画面的同时,显卡的负担也大大减轻。根据相关报道,英伟达在最新的 DLSS310.3.0版本中,对 Transformer 模型的显存占用进行了20% 的优化。之前,DLSS 的 Transformer 模型在显存使用上几乎是传统 CNN 模型的两倍,这让不少玩家在高分辨率游戏时感到压力。然而,经过优化后,Transformer 模型的显存占用仅比 CNN 模型多出40%。在1

阿里Ovis-U1震撼发布:多模态AI三合一,开源赋能全球开发者
2025年6月29日,阿里巴巴国际AI团队正式发布了全新多模态大模型 **Ovis-U1**,标志着其在多模态人工智能领域的又一重大突破。作为Ovis系列的最新力作,Ovis-U1将多模态理解、图像生成和图像编辑功能融为一体,展现了强大的跨模态处理能力,为开发者、研究者和行业应用提供了全新的可能性。以下是AIbase对Ovis-U1的详细报道。Ovis-U1:三合一的多模态统一框架Ovis-U1是阿里巴巴国际AI团队基于Ovis系列架构打造的3亿参数模型,首次实现了多模态理解、文生图像和图像编辑的统一。据AIbase了解,该模

腾讯开源 Hunyuan-A13B:小尺寸,大智慧的 AI 模型
Hunyuan-A13B 是一个由腾讯最新开源的大语言模型,它以创新的设计理念,在相对较小的活跃参数规模下,实现了强大的性能表现,特别适用于资源受限的环境。这款模型采用了细粒度 MoE(Mixture-of-Experts)架构,拥有130亿活跃参数,但总参数量高达800亿。这种设计让它在保持高效和可扩展性的同时,能够提供前沿的推理能力和通用应用支持。Hunyuan-A13B 的核心功能亮点包括:支持快慢思维的混合推理模式:这种独特的推理机制让模型能够根据任务需求灵活调整思考深度,提升处理复杂问题的效率