ADK Gemini Live API Toolkit¶
Gemini Live API Toolkit in ADK adds the low-latency bidirectional voice and video interaction capability of Gemini Live API to AI agents.
With ADK Gemini Live API Toolkit, you can provide end users with the experience of natural, human-like voice conversations, including the ability for the user to interrupt the agent's responses with voice commands. Agents with streaming can process text, audio, and video inputs, and they can provide text and audio output.
-
Quickstart (Gemini Live API Toolkit)
在此快速入门中,你将构建一个简单的智能体,并使用 ADK 中的流式处理来实现低延迟和双向语音与视频通信。
-
Gemini Live API Toolkit Demo Application
A production-ready reference implementation showcasing ADK Gemini Live API Toolkit with multimodal support (text, audio, image). This FastAPI-based demo demonstrates real-time WebSocket communication, automatic transcription, tool calling with Google Search, and complete streaming lifecycle management. This demo is extensively referenced throughout the development guide series.
-
Blog post: ADK Gemini Live API Toolkit Visual Guide
使用 ADK Gemini Live API Toolkit 进行多模态实时 AI 智能体开发的视觉指南。本文提供了直观的图表和插图,帮助你理解流式处理的工作原理以及如何构建交互式 AI 智能体。
-
Gemini Live API Toolkit development guide series
一个深入研究 ADK Gemini Live API Toolkit 开发的文章系列。你可以学习基本概念、用例、核心 API 以及端到端应用设计。
- 第 1 部分:ADK Gemini Live API Toolkit 入门 —— 流式处理基础、Live API 技术、ADK 架构组件以及带有 FastAPI 示例的完整应用程序生命周期
- 第 2 部分:使用 LiveRequestQueue 发送消息 —— 上行消息流、发送文本/音频/视频、活动信号以及并发模式
- 第 3 部分:使用 run_live() 进行事件处理 —— 处理事件、处理文本/音频/转录、自动工具执行以及多智能体工作流
- 第 4 部分:理解 RunConfig —— 响应模态、流式模式、会话管理、会话恢复、上下文窗口压缩以及配额管理
- 第 5 部分:如何使用音频、图像和视频 —— 音频规范、模型架构、音频转录、语音活动检测以及主动/情感对话功能
-
流式处理工具
流式处理工具允许工具(函数)将中间结果流式传输回智能体,智能体可以对这些中间结果做出响应。例如,我们可以使用流式处理工具来监控股票价格的变化,并让智能体对此做出反应。另一个例子是我们可以让智能体监控视频流,当视频流发生变化时,智能体可以报告这些变化。
-
博客文章:Google ADK + Vertex AI Live API
本文展示了如何在 ADK 中使用 Gemini Live API Toolkit 进行实时音频/视频流式传输。它提供了一个使用
LiveRequestQueue构建自定义交互式 AI 智能体的 Python 服务器示例。 -
博客文章:使用 Claude 代码技能加速 ADK 开发
本文演示了如何使用 Claude Coding Skills 加速 ADK 开发,并包含一个构建流式聊天应用的示例。了解如何利用 AI 驱动的代码辅助更快速地构建更出色的智能体。