ADK 中的流式处理¶
Info
这是一个实验性功能。目前仅在 Python 中可用。
ADK 中的流式处理为 AI 智能体添加了 Gemini Live API 的低延迟双向语音和视频交互能力。
使用流式模式,你可以为终端用户提供自然、类人的语音对话体验,包括用户能够通过语音命令打断智能体的响应。具有流式功能的智能体可以处理文本、音频和视频输入,并能提供文本和音频输出。
-
快速入门(流式处理)
在此快速入门中,你将构建一个简单的智能体,并使用 ADK 中的流式处理来实现低延迟和双向语音与视频通信。
-
流式处理工具
流式处理工具允许工具(函数)将中间结果流式传输回智能体,智能体可以对这些中间结果做出响应。例如,我们可以使用流式处理工具来监控股票价格的变化,并让智能体对此做出反应。另一个例子是我们可以让智能体监控视频流,当视频流中有变化时,智能体可以报告这些变化。
-
自定义音频流式处理应用示例
本文概述了使用 ADK 流式处理和 FastAPI 构建的自定义异步 web 应用的服务器和客户端代码,实现实时、双向的音频和文本通信。
-
Shopper's Concierge demo
了解如何使用 ADK 中的流式处理来构建个人购物助手,它能够理解你的个人风格并提供量身定制的推荐。