
Google I/O 2026 发布了大量开发者工具,我最想实际用的是 Gemini API 的托管 Agent。
核心卖点很简单:一次 API 调用就能搞定一个完整功能的 Agent,带远程执行沙箱。不用搭基础设施,不用管云服务器,不用手动配置 Antigravity agent 框架。你只管写 Agent 逻辑,剩下的环境配置 Google 全包了。
这篇文章聊聊托管 Agent 到底是什么、和之前的 Gemini API 有什么区别、以及怎么跑起来。
在这之前的 I/O 2026,Gemini API 有两种玩法:
方案 A——无状态调用: 发一个 Prompt,拿一个回复。做问答类需求还行,但凡需要多步骤、状态保持、或者代码执行,直接歇菜。
方案 B——自己搭基础设施: 起 VM、装 Antigravity 框架(Google 在 I/O 2025 发布的 alpha 版 agent 运行时)、自己管沙箱和凭证隔离、部署上线。功能是强,但绝对不是一个 30 分钟入门能搞定的事。
托管 Agent 把这个选择直接压缩成一个 API 调用。Agent 框架跑在 Google 的基础设施上,你拿到远程沙箱、工具执行、持久化状态,不用准备任何东西。
一个托管 Agent 提供这些能力:
本质上就是把 Antigravity 2.0(Google 的 agent 优先开发平台,同样在 I/O 2026 发布)做成了 API 服务。
进入 Google AI Studio,创建一个新项目,在 Experimental 部分启用 Managed Agents 功能。你需要有一个 Gemini API key。
pip install google-generativeai>=0.8.0
import google.generativeai as genai genai.configure(api_key="YOUR_API_KEY") # Define the tools your agent can use
def search_documentation(query: str) -> str: """Search technical documentation for a given query.""" # Your implementation here return f"Documentation results for: {query}" def run_code(code: str, language: str = "python") -> dict: """Execute a code snippet and return the result.""" # The Managed Agent sandbox handles actual execution return {"stdout": "...", "stderr": "", "exit_code": 0} # Create the agent — Managed Agents handles the rest
agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[search_documentation, run_code], system_instruction=( "You are a technical assistant. When asked about code, " "search the docs first, then write and test code to verify your answer." ),
) # Run the agent — it will use tools, iterate, and return a complete answer
result = agent.run( "Show me how to implement rate limiting in FastAPI with Redis"
)
print(result.text)
这个调用是阻塞式的——一直跑到 Agent 认为拿到完整答案为止。底层是 Gemini 3.5 Flash 在编排工具调用、合成结果、自动迭代。
生产环境里你肯定需要异步和流式输出,不然你的应用会卡死:
import asyncio async def run_agent_async(): agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[search_documentation, run_code], system_instruction="You are a technical assistant.", ) # Stream the agent's output as it works async for event in agent.run_stream("Explain and demonstrate async context managers"): if event.type == "text": print(event.text, end="", flush=True) elif event.type == "tool_call": print(f"\n[Calling tool: {event.tool_name}]") elif event.type == "tool_result": print(f"[Tool returned: {event.result[:100]}...]") asyncio.run(run_agent_async())
事件流让你能看到 Agent 在干活——对那些耗时长的任务,空白的 loading 动画会严重拉低体验,这种方式好很多。
托管 Agent 和标准 API 调用的一个核心区别是后台定时任务:
# Register a task that runs every day at 9am
agent.schedule_task( prompt=( "Check the GitHub repository for new issues labeled 'bug'. " "For each new issue, search the codebase for the relevant component " "and add a comment with likely root causes and affected files." ), schedule="0 9 * * *", # cron syntax name="daily-issue-triage",
)
这个不需要保持连接就能跑。托管 Agent 运行时负责调度、执行、记录日志。你可以通过 API 或者在 AI Studio 里查看任务状态和结果。
对于能自然拆解成并行任务的需求,托管 Agent 支持通过 Antigravity 集成动态启动子 Agent:
agent = genai.ManagedAgent( model="gemini-3.5-flash", tools=[...], system_instruction=( "You orchestrate research tasks. When given a broad topic, " "break it into parallel sub-tasks and spawn subagents to handle each. " "Synthesize their results into a unified response." ), enable_subagents=True, # enables dynamic subagent spawning
) result = agent.run( "Research the current state of WebAssembly runtimes: " "performance benchmarks, language support, production adoption, " "and future roadmap. Cover all angles in parallel."
)
主 Agent 负责拆解任务、派生出专门的子 Agent 处理各个子问题、再合成结果——并行执行的事它自动搞定。
在 AI Studio 里构建好 Agent 之后,I/O 2026 更新加了一键Deploy to Cloud Run 功能。前两个应用免费,不用绑卡。这是从原型到公开可访问端点最快的路。
代码化部署的话:
# From the Antigravity CLI (also new at I/O 2026)
antigravity deploy my-agent \ --runtime managed \ --region us-central1 \ --model gemini-3.5-flash
如果觉得托管 Agent API 还不够你折腾,Antigravity 2.0 是完整平台:
托管 Agent 是给不想管基础设施的开发者的 Antigravity。Antigravity 2.0 是给想要全控的开发者的。
真正好的地方: 抽象做对了。基础设施对大多数 Agent 场景就应该透明。托管 Agent 搞定了 80% 的场景——有状态的、会用工具的、跑在云上的 Agent,真的变简单了。
需要注意的地方: 沙箱是 Google 的基础设施。对于需要访问内部系统、私有数据库、自定义工具链的 Agent,托管 Agent 沙箱有局限。Antigravity CLI 路线灵活度更高,但上手成本也更高。
计费模式要搞清楚: 定时任务和长时间运行的 Agent 累积费用的方式和 stateless API 调用完全不同。在拿生产数据跑定时任务之前,先充分测试。
托管 Agent 是打造 Gemini 生产级 Agent 的"开箱即用"方案。一次 API 调用,加上一组工具和系统提示词,就能从一个想法到一个已部署的、有状态的、会用工具的 Agent。
定时任务和子 Agent 功能是让这个功能从 Demo 变成值得投入的基础设施的关键。Gemini 3.5 Flash 的速度加上托管 Agent 的基础设施,让 Google I/O 主题演讲里"Agent 时代"的说法不再空洞。
这周就动手试试。从"这东西能不能做"到一个已部署的端点,现在只需要几分钟,而不是几天。