site logo

Marico's space

Gemini API 托管 Agent 快速上手——从 Prompt 到部署的最快路径

编程技术 2026-06-03 11:28:31 5

Google I/O 2026 发布了大量开发者工具,我最想实际用的是 Gemini API 的托管 Agent

核心卖点很简单:一次 API 调用就能搞定一个完整功能的 Agent,带远程执行沙箱。不用搭基础设施,不用管云服务器,不用手动配置 Antigravity agent 框架。你只管写 Agent 逻辑,剩下的环境配置 Google 全包了。

这篇文章聊聊托管 Agent 到底是什么、和之前的 Gemini API 有什么区别、以及怎么跑起来。

托管 Agent 要解决什么问题

在这之前的 I/O 2026,Gemini API 有两种玩法:

方案 A——无状态调用: 发一个 Prompt,拿一个回复。做问答类需求还行,但凡需要多步骤、状态保持、或者代码执行,直接歇菜。

方案 B——自己搭基础设施: 起 VM、装 Antigravity 框架(Google 在 I/O 2025 发布的 alpha 版 agent 运行时)、自己管沙箱和凭证隔离、部署上线。功能是强,但绝对不是一个 30 分钟入门能搞定的事。

托管 Agent 把这个选择直接压缩成一个 API 调用。Agent 框架跑在 Google 的基础设施上,你拿到远程沙箱、工具执行、持久化状态,不用准备任何东西。

实际拿到什么

一个托管 Agent 提供这些能力:

  • 远程执行沙箱 — 代码跑在 Google 的基础设施上,不是你本地
  • 持久化状态 — Agent 在工具调用之间和整个会话期间维持上下文
  • 工具调用 — Agent 可以调用你定义的函数、抓取 URL、运行代码
  • 并行子 Agent — 通过 Antigravity 的动态子 Agent 系统,Agent 可以启动专门的子 Agent 处理并行任务
  • 定时任务 — 后台任务按计划运行,不需要保持连接

本质上就是把 Antigravity 2.0(Google 的 agent 优先开发平台,同样在 I/O 2026 发布)做成了 API 服务。

快速上手

1. 在 AI Studio 开启托管 Agent

进入 Google AI Studio,创建一个新项目,在 Experimental 部分启用 Managed Agents 功能。你需要有一个 Gemini API key。

2. 安装 SDK

pip install google-generativeai>=0.8.0

3. 写一个托管 Agent

import google.generativeai as genai genai.configure(api_key="YOUR_API_KEY") # Define the tools your agent can use
def search_documentation(query: str) -> str: """Search technical documentation for a given query.""" # Your implementation here return f"Documentation results for: {query}" def run_code(code: str, language: str = "python") -> dict: """Execute a code snippet and return the result.""" # The Managed Agent sandbox handles actual execution return {"stdout": "...", "stderr": "", "exit_code": 0} # Create the agent — Managed Agents handles the rest
agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[search_documentation, run_code], system_instruction=( "You are a technical assistant. When asked about code, " "search the docs first, then write and test code to verify your answer." ),
) # Run the agent — it will use tools, iterate, and return a complete answer
result = agent.run( "Show me how to implement rate limiting in FastAPI with Redis"
)
print(result.text)

这个调用是阻塞式的——一直跑到 Agent 认为拿到完整答案为止。底层是 Gemini 3.5 Flash 在编排工具调用、合成结果、自动迭代。

异步和流式

生产环境里你肯定需要异步和流式输出,不然你的应用会卡死:

import asyncio async def run_agent_async(): agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[search_documentation, run_code], system_instruction="You are a technical assistant.", ) # Stream the agent's output as it works async for event in agent.run_stream("Explain and demonstrate async context managers"): if event.type == "text": print(event.text, end="", flush=True) elif event.type == "tool_call": print(f"\n[Calling tool: {event.tool_name}]") elif event.type == "tool_result": print(f"[Tool returned: {event.result[:100]}...]") asyncio.run(run_agent_async())

事件流让你能看到 Agent 在干活——对那些耗时长的任务,空白的 loading 动画会严重拉低体验,这种方式好很多。

定时任务

托管 Agent 和标准 API 调用的一个核心区别是后台定时任务

# Register a task that runs every day at 9am
agent.schedule_task( prompt=( "Check the GitHub repository for new issues labeled 'bug'. " "For each new issue, search the codebase for the relevant component " "and add a comment with likely root causes and affected files." ), schedule="0 9 * * *", # cron syntax name="daily-issue-triage",
)

这个不需要保持连接就能跑。托管 Agent 运行时负责调度、执行、记录日志。你可以通过 API 或者在 AI Studio 里查看任务状态和结果。

并行子 Agent

对于能自然拆解成并行任务的需求,托管 Agent 支持通过 Antigravity 集成动态启动子 Agent:

agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[...], system_instruction=( "You orchestrate research tasks. When given a broad topic, " "break it into parallel sub-tasks and spawn subagents to handle each. " "Synthesize their results into a unified response." ), enable_subagents=True, # enables dynamic subagent spawning
) result = agent.run( "Research the current state of WebAssembly runtimes: " "performance benchmarks, language support, production adoption, " "and future roadmap. Cover all angles in parallel."
)

主 Agent 负责拆解任务、派生出专门的子 Agent 处理各个子问题、再合成结果——并行执行的事它自动搞定。

一键部署到 Cloud Run

在 AI Studio 里构建好 Agent 之后,I/O 2026 更新加了一键Deploy to Cloud Run 功能。前两个应用免费,不用绑卡。这是从原型到公开可访问端点最快的路。

代码化部署的话:

# From the Antigravity CLI (also new at I/O 2026)
antigravity deploy my-agent \ --runtime managed \ --region us-central1 \ --model gemini-3.5-flash

Antigravity 2.0 额外带来什么

如果觉得托管 Agent API 还不够你折腾,Antigravity 2.0 是完整平台:

  • Antigravity CLI — 命令行起各种专用子 Agent
  • 跨平台终端沙箱 — 凭证遮蔽和强化的 Git 策略
  • Firebase 集成 — 做全栈应用,auth 和存储都带
  • 导出到 Netlify — 从 Google Stitch(新的 UI 设计工具)直接导出

托管 Agent 是给不想管基础设施的开发者的 Antigravity。Antigravity 2.0 是给想要全控的开发者的。

客观评价

真正好的地方: 抽象做对了。基础设施对大多数 Agent 场景就应该透明。托管 Agent 搞定了 80% 的场景——有状态的、会用工具的、跑在云上的 Agent,真的变简单了。

需要注意的地方: 沙箱是 Google 的基础设施。对于需要访问内部系统、私有数据库、自定义工具链的 Agent,托管 Agent 沙箱有局限。Antigravity CLI 路线灵活度更高,但上手成本也更高。

计费模式要搞清楚: 定时任务和长时间运行的 Agent 累积费用的方式和 stateless API 调用完全不同。在拿生产数据跑定时任务之前,先充分测试。

总结

托管 Agent 是打造 Gemini 生产级 Agent 的"开箱即用"方案。一次 API 调用,加上一组工具和系统提示词,就能从一个想法到一个已部署的、有状态的、会用工具的 Agent。

定时任务和子 Agent 功能是让这个功能从 Demo 变成值得投入的基础设施的关键。Gemini 3.5 Flash 的速度加上托管 Agent 的基础设施,让 Google I/O 主题演讲里"Agent 时代"的说法不再空洞。

这周就动手试试。从"这东西能不能做"到一个已部署的端点,现在只需要几分钟,而不是几天。

原文链接:https://dev.to/google-developers/getting-started-with-gemini-api-managed-agents-the-quickest-path-from-prompt-to-deployed-agent-1bp4