信息

AI新闻资讯

探索AI前沿，掌握行业发展趋势

AI 商用·开源产品库

精准筛选产品，多维度产品调研

AI 产品排行榜

热门AI产品实力、热度、年/月/日排行

AI产品提交

提交AI产品信息，助力产品推广和用户转化

工具

AI工具导航

一站式AI工具指南，快速找到你需要的工具

信息

模型库

涵盖各类AI模型，满足你的开发与研究需求

大模型排行榜

热门AI大模型性能、热度、年/月/日排行

模型供应商

寻找优质模型提供商，获取可靠模型支持

模型服务提交

提交模型信息和服务，精准推广和触达用户

工具

大模型选型对比

多维度对比大模型，找到最适合你的模型

大模型费用计算器

精准计算大模型使用成本，合理规划预算

大模型竞技场

多模型实时评测，模型输出结果快速比对

信息

MCP服务端

聚集热门MCP服务，快速找到适合你的服务

MCP客户端

轻松接入MCP客户端，调用强大的AI能力

MCP教程与实践

学习MCP使用技巧，从入门到精通

MCP排行榜

热门MCP服务性能排行，帮你找到最佳选择

MCP服务提交

发布你的MCP服务，推广你的MCP服务

工具

MCP实验场

自由测试MCP服务，线上快速体验

MCP服务调试器

快速测试MCP服务，快速上线

GEO 大模型推荐优化

通过AI搜索优化服务，让品牌在AI中实现霸屏

GEO排名查询工具

检测品牌在AI平台中的可见度

工具

模型个人电脑配置检测器

一键检测电脑配置，研判运行模型的兼容性

模型部署服务器配置计算器

根据算力需求，推荐匹配的服务器配置

AI应用指南

信息

数据集合

提供用于训练、评估和测试模型的数据集

工具

智能文档识别解析

提供各类文档文字提取，支持自定义场景

谷歌DeepMind开源GenAI Processors：一键构建实时AI工作流

AIbase基地

发布于AI新闻资讯 · 1 分钟阅读 · Jul 11, 2025

719

谷歌DeepMind近日宣布开源全新Python库“GenAI Processors”，为开发者提供了一个轻量级、高效的工具，用于构建异步、可组合的生成式AI工作流。这一开源库旨在简化复杂多模态AI应用的开发过程，支持实时处理音频、视频和文本等多模态数据，显著提升了基于Gemini API的应用程序开发效率。

GenAI Processors功能亮点:模块化与异步处理

GenAI Processors的核心是一个统一的“Processor”接口，开发者可通过该接口将复杂AI工作流分解为模块化的处理单元。这些单元能够处理从输入预处理到模型调用再到输出生成的全流程，支持音频片段、文本转录、图像帧等多模态数据的异步流处理。AIbase编辑部测试发现，该库通过Python的asyncio机制优化了并发执行，显著降低了I/O密集型任务的延迟，使实时应用如语音助手或视频处理工具的开发更加高效。

该库特别针对谷歌Gemini API进行了优化，内置了GenaiModel和LiveProcessor两种处理器，分别支持基于回合的交互和实时流处理。开发者只需几行代码即可构建支持麦克风、摄像头输入的实时AI代理。例如，结合视频和音频输入的处理流程，GenAI Processors能够快速构建实时翻译或智能助手类应用，展现出强大的灵活性和可扩展性。

技术内核:流式API与并发优化

GenAI Processors以流式API为核心，将所有输入和输出视为ProcessorParts的异步数据流，每个数据单元（如音频片段或图像帧）均附带元数据。这种设计不仅保证了数据流的有序性，还通过内置的并发优化机制最大程度减少了“首token时间”(Time To First Token)。AIbase了解到，该库的模块化设计允许开发者将不同处理单元无缝连接，构建复杂的工作流，同时保持代码的可复用性和可维护性。

目前，GenAI Processors仅支持Python，但其核心目录包含了基础处理器，社区开发者可通过contrib目录贡献专用功能。谷歌DeepMind表示，未来将通过社区协作进一步扩展库的功能，覆盖更多场景和编程语言。

行业影响:加速生成式AI应用开发

GenAI Processors的开源发布为开发者提供了构建高性能Gemini应用的便捷工具，尤其在实时多模态处理场景中表现出色。与传统的生成式AI开发框架相比，该库通过模块化和异步处理显著降低了开发复杂性，特别适合需要低延迟的实时应用，如智能客服、实时翻译和多模态交互代理。AIbase分析认为，GenAI Processors的开源将进一步推动生成式AI生态的开放性，吸引更多开发者参与创新。

尽管目前该库尚处于早期阶段，功能覆盖面有限，但其开放的GitHub仓库（https://github.com/google-gemini/genai-processors）为社区贡献提供了广阔空间。AIbase注意到，部分开发者反馈希望看到更多语言支持和预训练模型集成，谷歌DeepMind已表示将持续迭代，未来可能引入对其他主流AI模型的支持。

本文来自AIbase日报

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

—— 由AIbase 日报组创作