Gemini API 托管 Agent 快速上手——从 Prompt 到部署的最快路径

编程技术 2026-06-03 11:28:31 37

Google I/O 2026 发布了大量开发者工具，我最想实际用的是 Gemini API 的托管 Agent。

核心卖点很简单：一次 API 调用就能搞定一个完整功能的 Agent，带远程执行沙箱。不用搭基础设施，不用管云服务器，不用手动配置 Antigravity agent 框架。你只管写 Agent 逻辑，剩下的环境配置 Google 全包了。

这篇文章聊聊托管 Agent 到底是什么、和之前的 Gemini API 有什么区别、以及怎么跑起来。

托管 Agent 要解决什么问题

在这之前的 I/O 2026，Gemini API 有两种玩法：

方案 A——无状态调用： 发一个 Prompt，拿一个回复。做问答类需求还行，但凡需要多步骤、状态保持、或者代码执行，直接歇菜。

方案 B——自己搭基础设施： 起 VM、装 Antigravity 框架（Google 在 I/O 2025 发布的 alpha 版 agent 运行时）、自己管沙箱和凭证隔离、部署上线。功能是强，但绝对不是一个 30 分钟入门能搞定的事。

托管 Agent 把这个选择直接压缩成一个 API 调用。Agent 框架跑在 Google 的基础设施上，你拿到远程沙箱、工具执行、持久化状态，不用准备任何东西。

实际拿到什么

一个托管 Agent 提供这些能力：

远程执行沙箱 — 代码跑在 Google 的基础设施上，不是你本地
持久化状态 — Agent 在工具调用之间和整个会话期间维持上下文
工具调用 — Agent 可以调用你定义的函数、抓取 URL、运行代码
并行子 Agent — 通过 Antigravity 的动态子 Agent 系统，Agent 可以启动专门的子 Agent 处理并行任务
定时任务 — 后台任务按计划运行，不需要保持连接

本质上就是把 Antigravity 2.0（Google 的 agent 优先开发平台，同样在 I/O 2026 发布）做成了 API 服务。

快速上手

1. 在 AI Studio 开启托管 Agent

进入 Google AI Studio，创建一个新项目，在 Experimental 部分启用 Managed Agents 功能。你需要有一个 Gemini API key。

2. 安装 SDK

pip install google-generativeai>=0.8.0

3. 写一个托管 Agent

import google.generativeai as genai genai.configure(api_key="YOUR_API_KEY") # Define the tools your agent can use
def search_documentation(query: str) -> str: """Search technical documentation for a given query.""" # Your implementation here return f"Documentation results for: {query}" def run_code(code: str, language: str = "python") -> dict: """Execute a code snippet and return the result.""" # The Managed Agent sandbox handles actual execution return {"stdout": "...", "stderr": "", "exit_code": 0} # Create the agent — Managed Agents handles the rest
agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[search_documentation, run_code], system_instruction=( "You are a technical assistant. When asked about code, " "search the docs first, then write and test code to verify your answer." ),
) # Run the agent — it will use tools, iterate, and return a complete answer
result = agent.run( "Show me how to implement rate limiting in FastAPI with Redis"
)
print(result.text)

这个调用是阻塞式的——一直跑到 Agent 认为拿到完整答案为止。底层是 Gemini 3.5 Flash 在编排工具调用、合成结果、自动迭代。

异步和流式

生产环境里你肯定需要异步和流式输出，不然你的应用会卡死：

import asyncio async def run_agent_async(): agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[search_documentation, run_code], system_instruction="You are a technical assistant.", ) # Stream the agent's output as it works async for event in agent.run_stream("Explain and demonstrate async context managers"): if event.type == "text": print(event.text, end="", flush=True) elif event.type == "tool_call": print(f"\n[Calling tool: {event.tool_name}]") elif event.type == "tool_result": print(f"[Tool returned: {event.result[:100]}...]") asyncio.run(run_agent_async())

事件流让你能看到 Agent 在干活——对那些耗时长的任务，空白的 loading 动画会严重拉低体验，这种方式好很多。

定时任务

托管 Agent 和标准 API 调用的一个核心区别是后台定时任务：

# Register a task that runs every day at 9am
agent.schedule_task( prompt=( "Check the GitHub repository for new issues labeled 'bug'. " "For each new issue, search the codebase for the relevant component " "and add a comment with likely root causes and affected files." ), schedule="0 9 * * *", # cron syntax name="daily-issue-triage",
)

这个不需要保持连接就能跑。托管 Agent 运行时负责调度、执行、记录日志。你可以通过 API 或者在 AI Studio 里查看任务状态和结果。

并行子 Agent

对于能自然拆解成并行任务的需求，托管 Agent 支持通过 Antigravity 集成动态启动子 Agent：

agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[...], system_instruction=( "You orchestrate research tasks. When given a broad topic, " "break it into parallel sub-tasks and spawn subagents to handle each. " "Synthesize their results into a unified response." ), enable_subagents=True, # enables dynamic subagent spawning
) result = agent.run( "Research the current state of WebAssembly runtimes: " "performance benchmarks, language support, production adoption, " "and future roadmap. Cover all angles in parallel."
)

主 Agent 负责拆解任务、派生出专门的子 Agent 处理各个子问题、再合成结果——并行执行的事它自动搞定。

一键部署到 Cloud Run

在 AI Studio 里构建好 Agent 之后，I/O 2026 更新加了一键Deploy to Cloud Run 功能。前两个应用免费，不用绑卡。这是从原型到公开可访问端点最快的路。

代码化部署的话：

# From the Antigravity CLI (also new at I/O 2026)
antigravity deploy my-agent \ --runtime managed \ --region us-central1 \ --model gemini-3.5-flash

Antigravity 2.0 额外带来什么

如果觉得托管 Agent API 还不够你折腾，Antigravity 2.0 是完整平台：

Antigravity CLI — 命令行起各种专用子 Agent
跨平台终端沙箱 — 凭证遮蔽和强化的 Git 策略
Firebase 集成 — 做全栈应用，auth 和存储都带
导出到 Netlify — 从 Google Stitch（新的 UI 设计工具）直接导出

托管 Agent 是给不想管基础设施的开发者的 Antigravity。Antigravity 2.0 是给想要全控的开发者的。

客观评价

真正好的地方： 抽象做对了。基础设施对大多数 Agent 场景就应该透明。托管 Agent 搞定了 80% 的场景——有状态的、会用工具的、跑在云上的 Agent，真的变简单了。

需要注意的地方： 沙箱是 Google 的基础设施。对于需要访问内部系统、私有数据库、自定义工具链的 Agent，托管 Agent 沙箱有局限。Antigravity CLI 路线灵活度更高，但上手成本也更高。

计费模式要搞清楚： 定时任务和长时间运行的 Agent 累积费用的方式和 stateless API 调用完全不同。在拿生产数据跑定时任务之前，先充分测试。

总结

托管 Agent 是打造 Gemini 生产级 Agent 的"开箱即用"方案。一次 API 调用，加上一组工具和系统提示词，就能从一个想法到一个已部署的、有状态的、会用工具的 Agent。

定时任务和子 Agent 功能是让这个功能从 Demo 变成值得投入的基础设施的关键。Gemini 3.5 Flash 的速度加上托管 Agent 的基础设施，让 Google I/O 主题演讲里"Agent 时代"的说法不再空洞。

这周就动手试试。从"这东西能不能做"到一个已部署的端点，现在只需要几分钟，而不是几天。

原文链接：https://dev.to/google-developers/getting-started-with-gemini-api-managed-agents-the-quickest-path-from-prompt-to-deployed-agent-1bp4