部署到 Cloud Run¶

Cloud Run 是一个完全托管的平台，使你能够直接在 Google 可扩展基础设施上运行代码。

要部署你的智能体，你可以使用 adk deploy cloud_run 命令 （推荐用于 Python），或通过 Cloud Run 使用 gcloud run deploy 命令。

智能体示例¶

对于每个命令，我们将引用在 LLM 智能体页面上定义的 Capital Agent 示例。我们假设它在一个目录中（例如：capital_agent）。

继续之前，请确认你的智能体代码配置如下：

PythonJava

智能体代码在你的智能体目录中名为 agent.py 的文件中。
你的智能体变量名为 root_agent。
__init__.py 在你的智能体目录中，并包含 from . import agent。

智能体代码在你的智能体目录中名为 CapitalAgent.java 的文件中。
你的智能体变量是全局的，并遵循 public static BaseAgent ROOT_AGENT 格式。
你的智能体定义存在于静态类方法中。

有关更多详细信息，请参阅以下部分。你还可以在 Github 仓库中找到一个示例应用。

环境变量¶

按照设置和安装指南中描述的设置环境变量。

export GOOGLE_CLOUD_PROJECT=your-project-id
export GOOGLE_CLOUD_LOCATION=us-central1 # 或你偏好的位置
export GOOGLE_GENAI_USE_VERTEXAI=True

（将 your-project-id 替换为你实际的 GCP 项目 ID）

部署命令¶

Python - adk CLIPython - gcloud CLIJava - gcloud CLI

adk CLI¶

adk deploy cloud_run 命令将你的智能体代码部署到 Google Cloud Run。

确保你已通过 Google Cloud 进行身份验证（gcloud auth login 和 gcloud config set project <your-project-id>）。

设置环境变量¶

可选但推荐：设置环境变量可以使部署命令更简洁。

# 设置你的 Google Cloud 项目 ID
export GOOGLE_CLOUD_PROJECT="your-gcp-project-id"

# 设置你期望的 Google Cloud 位置
export GOOGLE_CLOUD_LOCATION="us-central1" # 示例位置

# 设置你的智能体代码目录路径
export AGENT_PATH="./capital_agent" # 假设 capital_agent 在当前目录中

# 设置你的 Cloud Run 服务名称（可选）
export SERVICE_NAME="capital-agent-service"

# 设置应用程序名称（可选）
export APP_NAME="capital-agent-app"

命令用法¶

最小命令¶

adk deploy cloud_run \
--project=$GOOGLE_CLOUD_PROJECT \
--region=$GOOGLE_CLOUD_LOCATION \
$AGENT_PATH

带可选标志的完整命令¶

adk deploy cloud_run \
--project=$GOOGLE_CLOUD_PROJECT \
--region=$GOOGLE_CLOUD_LOCATION \
--service_name=$SERVICE_NAME \
--app_name=$APP_NAME \
--with_ui \
$AGENT_PATH

参数¶

AGENT_PATH: （必需）指定包含你的智能体源代码的目录路径的位置参数（例如，示例中的 $AGENT_PATH，或 capital_agent/）。此目录必须至少包含一个 __init__.py 和你的主智能体文件（例如，agent.py）。

选项¶

--project TEXT：（必需）你的 Google Cloud 项目 ID（例如，$GOOGLE_CLOUD_PROJECT）。
--region TEXT：（必需）部署的 Google Cloud 位置（例如，$GOOGLE_CLOUD_LOCATION，us-central1）。
--service_name TEXT：（可选）Cloud Run 服务的名称（例如，$SERVICE_NAME）。默认为 adk-default-service-name。
--app_name TEXT：（可选）ADK API 服务器的应用程序名称（例如，$APP_NAME）。默认为由 AGENT_PATH 指定的目录名称（例如，如果 AGENT_PATH 是 ./capital_agent，则为 capital_agent）。
--agent_engine_id TEXT：（可选）如果你通过 Vertex AI Agent Engine 使用托管会话服务，请在此处提供其资源 ID。
--port INTEGER：（可选）ADK API 服务器在容器内监听的端口号。默认为 8000。
--with_ui：（可选）如果包含，将与智能体 API 服务器一起部署 ADK 开发 UI。默认情况下，仅部署 API 服务器。
--temp_folder TEXT：（可选）指定用于存储部署过程中生成的中间文件的目录。默认为系统临时目录中的时间戳文件夹。（注意：除非排除故障，否则通常不需要此选项）。
--help：显示帮助信息并退出。

身份验证访问¶

在部署过程中，你可能会收到提示：Allow unauthenticated invocations to [your-service-name] (y/N)?。

输入 y 允许在没有身份验证的情况下公开访问你的智能体的 API 端点。
输入 N（或按 Enter 键使用默认值）要求身份验证（例如，使用"测试你的智能体"部分中显示的身份令牌）。

成功执行后，命令将你的智能体部署到 Cloud Run 并提供已部署服务的 URL。

gcloud CLI¶

或者，你可以使用标准的 gcloud run deploy 命令和 Dockerfile 进行部署。与 adk 命令相比，这种方法需要更多的手动设置，但提供了灵活性，特别是如果你想要将智能体嵌入到自定义 FastAPI 应用程序中。

确保你已通过 Google Cloud 进行身份验证（gcloud auth login 和 gcloud config set project <your-project-id>）。

项目结构¶

按如下方式组织你的项目文件：

your-project-directory/
├── capital_agent/
│   ├── __init__.py
│   └── agent.py       # 你的智能体代码（见"智能体示例"标签）
├── main.py            # FastAPI 应用程序入口点
├── requirements.txt   # Python 依赖项
└── Dockerfile         # 容器构建说明

在 your-project-directory/ 的根目录下创建以下文件（main.py、requirements.txt、Dockerfile）。

代码文件¶

这个文件使用 ADK 的 get_fast_api_app() 设置 FastAPI 应用程序：

main.py

import os

import uvicorn
from google.adk.cli.fast_api import get_fast_api_app

# 获取 main.py 所在的目录
AGENT_DIR = os.path.dirname(os.path.abspath(__file__))
# 示例会话数据库 URL（如 SQLite）
SESSION_DB_URL = "sqlite:///./sessions.db"
# CORS 允许的来源示例
ALLOWED_ORIGINS = ["http://localhost", "http://localhost:8080", "*"]
# 如果你打算提供 Web 界面则设置为 True，否则为 False
SERVE_WEB_INTERFACE = True

# Call the function to get the FastAPI app instance
# Ensure the agent directory name ('capital_agent') matches your agent folder
app = get_fast_api_app(
    agent_dir=AGENT_DIR,
    session_db_url=SESSION_DB_URL,
    allow_origins=ALLOWED_ORIGINS,
    web=SERVE_WEB_INTERFACE,
)

# 如有需要，你可以在下方添加更多 FastAPI 路由或配置
# 示例：
# @app.get("/hello")
# async def read_root():
#     return {"Hello": "World"}

if __name__ == "__main__":
    # 使用 Cloud Run 提供的 PORT 环境变量，默认为 8080
    uvicorn.run(app, host="0.0.0.0", port=int(os.environ.get("PORT", 8080)))

注意：我们将 agent_dir 指定为 main.py 所在的目录，并使用 os.environ.get("PORT", 8080) 以确保与 Cloud Run 兼容。

列出必要的 Python 包：

requirements.txt

google_adk
# 添加你的智能体所需的其他依赖项

定义容器镜像：

Dockerfile

FROM python:3.13-slim
WORKDIR /app

COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

RUN adduser --disabled-password --gecos "" myuser && \
    chown -R myuser:myuser /app

COPY . .

USER myuser

ENV PATH="/home/myuser/.local/bin:$PATH"

CMD ["sh", "-c", "uvicorn main:app --host 0.0.0.0 --port $PORT"]

Defining Multiple Agents¶

You can define and deploy multiple agents within the same Cloud Run instance by creating separate folders in the root of your-project-directory/. Each folder represents one agent and must define a root_agent in its configuration.

Example structure:

your-project-directory/
├── capital_agent/
│   ├── __init__.py
│   └── agent.py       # contains `root_agent` definition
├── population_agent/
│   ├── __init__.py
│   └── agent.py       # contains `root_agent` definition
└── ...

Deploy using `gcloud`¶

在终端中导航到 your-project-directory。

gcloud run deploy capital-agent-service \
--source . \
--region $GOOGLE_CLOUD_LOCATION \
--project $GOOGLE_CLOUD_PROJECT \
--allow-unauthenticated \
--set-env-vars="GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT,GOOGLE_CLOUD_LOCATION=$GOOGLE_CLOUD_LOCATION,GOOGLE_GENAI_USE_VERTEXAI=$GOOGLE_GENAI_USE_VERTEXAI"
# 添加你的智能体可能需要的其他环境变量

capital-agent-service：你想要给 Cloud Run 服务的名称。
--source .：告诉 gcloud 从当前目录的 Dockerfile 构建容器镜像。
--region：指定部署区域。
--project：指定 GCP 项目。
--allow-unauthenticated：允许公开访问服务。为私有服务删除此标志。
--set-env-vars：将必要的环境变量传递给运行的容器。确保包含 ADK 和你的智能体所需的所有变量（如 API 密钥，如果不使用应用程序默认凭据）。

gcloud 将构建 Docker 镜像，将其推送到 Google Artifact Registry，并将其部署到 Cloud Run。完成后，它将输出已部署服务的 URL。

有关部署选项的完整列表，请参阅 gcloud run deploy 参考文档。

gcloud CLI¶

你可以使用标准的 gcloud run deploy 命令和 Dockerfile 部署 Java 智能体。这是目前将 Java 智能体部署到 Google Cloud Run 的推荐方式。

确保你已通过 Google Cloud 进行身份验证。具体来说，从终端运行命令 gcloud auth login 和 gcloud config set project <your-project-id>。

项目结构¶

按如下方式组织你的项目文件：

your-project-directory/
├── src/
│   └── main/
│       └── java/
│             └── agents/
│                 ├── capitalagent/
│                     └── CapitalAgent.java    # 你的智能体代码
├── pom.xml                                    # Java adk 和 adk-dev 依赖项
└── Dockerfile                                 # 容器构建说明

在项目目录的根目录下创建 pom.xml 和 Dockerfile。你的智能体代码文件（CapitalAgent.java）在如上所示的目录中。

代码文件¶

这是我们的智能体定义。这与 LLM 智能体中的代码相同，但有两个注意事项：
- 智能体现在被初始化为全局公共静态变量。
- 智能体的定义可以在静态方法中公开或在声明期间内联。
CapitalAgent.java

将以下依赖项和插件添加到 pom.xml 文件中。

pom.xml

<dependencies>
  <dependency>
     <groupId>com.google.adk</groupId>
     <artifactId>google-adk</artifactId>
     <version>0.1.0</version>
  </dependency>
  <dependency>
     <groupId>com.google.adk</groupId>
     <artifactId>google-adk-dev</artifactId>
     <version>0.1.0</version>
  </dependency>
</dependencies>

<plugin>
  <groupId>org.codehaus.mojo</groupId>
  <artifactId>exec-maven-plugin</artifactId>
  <version>3.2.0</version>
  <configuration>
    <mainClass>com.google.adk.web.AdkWebServer</mainClass>
    <classpathScope>compile</classpathScope>
  </configuration>
</plugin>

定义容器镜像：

Dockerfile

# Use an official Maven image with a JDK. Choose a version appropriate for your project.
FROM maven:3.8-openjdk-17 AS builder

WORKDIR /app

COPY pom.xml .
RUN mvn dependency:go-offline -B

COPY src ./src

# Expose the port your application will listen on.
# Cloud Run will set the PORT environment variable, which your app should use.
EXPOSE 8080

# The command to run your application.
# TODO(Developer): Update the "adk.agents.source-dir" to the directory that contains your agents.
# You can have multiple agents in this directory and all of them will be available in the Dev UI.
ENTRYPOINT ["mvn", "exec:java", \
    "-Dexec.mainClass=com.google.adk.web.AdkWebServer", \
    "-Dexec.classpathScope=compile", \
    "-Dexec.args=--server.port=${PORT} --adk.agents.source-dir=src/main/java" \
]

使用 `gcloud` 部署¶

在终端中导航到 your-project-directory。

gcloud run deploy capital-agent-service \
--source . \
--region $GOOGLE_CLOUD_LOCATION \
--project $GOOGLE_CLOUD_PROJECT \
--allow-unauthenticated \
--set-env-vars="GOOGLE_CLOUD_PROJECT=$GOOGLE_CLOUD_PROJECT,GOOGLE_CLOUD_LOCATION=$GOOGLE_CLOUD_LOCATION,GOOGLE_GENAI_USE_VERTEXAI=$GOOGLE_GENAI_USE_VERTEXAI"
# 添加你的智能体可能需要的其他必要环境变量

capital-agent-service：你想要给 Cloud Run 服务的名称。
--source .：告诉 gcloud 从当前目录的 Dockerfile 构建容器镜像。
--region：指定部署区域。
--project：指定 GCP 项目。
--allow-unauthenticated：允许公开访问服务。为私有服务删除此标志。
--set-env-vars：将必要的环境变量传递给运行的容器。确保包含 ADK 和你的智能体所需的所有变量（如 API 密钥，如果不使用应用程序默认凭据）。

gcloud 将构建 Docker 镜像，将其推送到 Google Artifact Registry，并将其部署到 Cloud Run。完成后，它将输出已部署服务的 URL。

有关部署选项的完整列表，请参阅 gcloud run deploy 参考文档。

测试你的智能体¶

一旦你的智能体部署到 Cloud Run，你可以通过已部署的 UI（如果启用）或使用 curl 等工具直接与其 API 端点交互。你需要部署后提供的服务 URL。

UI TestingAPI Testing (curl)

UI 测试¶

如果你部署了带有 UI 的智能体：

adk CLI：你在部署期间包含了 --with_ui 标志。
gcloud CLI：你在 main.py 中设置了 SERVE_WEB_INTERFACE = True。

你可以通过在网络浏览器中导航到部署后提供的 Cloud Run 服务 URL 来测试你的智能体。

# 示例 URL 格式
# https://your-service-name-abc123xyz.a.run.app

ADK 开发 UI 允许你直接在浏览器中与你的智能体交互，管理会话并查看执行详情。

要验证你的智能体是否按预期工作，你可以：

从下拉菜单中选择你的智能体。
输入一条消息并验证你是否收到来自你的智能体的预期响应。

如果遇到任何意外行为，请检查 Cloud Run 控制台日志。

API 测试 (curl)¶

你可以使用 curl 等工具与智能体的 API 端点交互。这对于程序化交互或者如果你部署时没有启用 UI 非常有用。

你需要部署后提供的服务 URL，如果你的服务未设置为允许未经身份验证的访问，可能还需要一个身份令牌进行身份验证。

设置应用程序 URL¶

将示例 URL 替换为你部署的 Cloud Run 服务的实际 URL。

export APP_URL="YOUR_CLOUD_RUN_SERVICE_URL"
# 示例：export APP_URL="https://adk-default-service-name-abc123xyz.a.run.app"

获取身份令牌（如需要）¶

如果你的服务需要身份验证（即，你没有使用 gcloud 的 --allow-unauthenticated 或在 adk 提示中回答了 'N'），请获取身份令牌。

export TOKEN=$(gcloud auth print-identity-token)

如果你的服务允许未经身份验证的访问，你可以在下面的 curl 命令中省略 -H "Authorization: Bearer $TOKEN" 标头。

列出可用的应用程序¶

验证已部署的应用程序名称。

curl -X GET -H "Authorization: Bearer $TOKEN" $APP_URL/list-apps

（如有需要，根据此输出调整以下命令中的 app_name。默认通常是智能体目录名称，例如 capital_agent）。

创建或更新会话¶

为特定用户和会话初始化或更新状态。如果不同，请将 capital_agent 替换为你的实际应用程序名称。值 user_123 和 session_abc 是示例标识符；你可以将它们替换为你想要的用户和会话 ID。

curl -X POST -H "Authorization: Bearer $TOKEN" \
    $APP_URL/apps/capital_agent/users/user_123/sessions/session_abc \
    -H "Content-Type: application/json" \
    -d '{"state": {"preferred_language": "English", "visit_count": 5}}'

运行智能体¶

向你的智能体发送提示。根据需要替换 capital_agent 为你的应用程序名称，并调整用户/会话 ID 和提示。

curl -X POST -H "Authorization: Bearer $TOKEN" \
    $APP_URL/run_sse \
    -H "Content-Type: application/json" \
    -d '{
    "app_name": "capital_agent",
    "user_id": "user_123",
    "session_id": "session_abc",
    "new_message": {
        "role": "user",
        "parts": [{
        "text": "What is the capital of Canada?"
        }]
    },
    "streaming": false
    }'

如果你想接收服务器发送事件 (SSE)，请设置 "streaming": true。
响应将包含智能体的执行事件，包括最终答案。

部署到 Cloud Run¶

智能体示例¶

环境变量¶

部署命令¶

adk CLI¶

设置环境变量¶

命令用法¶

最小命令¶

带可选标志的完整命令¶

参数¶

选项¶

身份验证访问¶

gcloud CLI¶

项目结构¶

代码文件¶

Defining Multiple Agents¶

Deploy using gcloud¶

gcloud CLI¶

项目结构¶

代码文件¶

使用 gcloud 部署¶

测试你的智能体¶

UI 测试¶

API 测试 (curl)¶

设置应用程序 URL¶

获取身份令牌（如需要）¶

列出可用的应用程序¶

创建或更新会话¶

运行智能体¶

Deploy using `gcloud`¶

使用 `gcloud` 部署¶