
最近把 Claude Security 折腾了一遍,踩了几个坑,这篇把问题说清楚。
一个月前 Claude Security 公测的时候,说实话更像是一个包装精致的扫描器,而不是一个能日常使用的工作流。你丢一个仓库给它,它像个安全研究员一样推理论证代码,然后甩出一堆发现和建议补丁。有用,但不好用。这周在 Claude.ai 侧边栏看到的版本完全是另一回事了。定时扫描、Slack 和 Jira 的 webhook、目录级别的定向,还有六家安全平台把同一个 Opus 4.7 模型嵌入到自家工具里。
发布时的卖点很简单。扫描仓库、用大白话解释漏洞而不是直接给你一堆 CVE 编号、给出修复建议,然后把决定权留给人类。一个月前的公测就是那个版本。缺的东西是扫描之外的所有环节。
这周那些缺口基本填满了。你可以定时跑扫描而不是手动触发,这很重要,因为安全债务总是在版本之间悄悄累积的。你可以定向到大型单体仓库里的单个目录,不用等整个树跑完,所以聚焦审查 payments 模块几分钟就能搞定,而不是一个小时。你可以导出发现结果为 CSV 或 Markdown,直接丢进现有 tracker 或审计记录里。还有 dismissal 功能——你可以用文档化的理由忽略某个发现,这个忽略会跨后续扫描持续保留,不用每周都重新分类同一个误报。
底层是一套多阶段验证管道。每个发现到达你面前之前都会经过检查,每个发现都带置信度评分。这个验证步骤才是决定扫描工具值不值得留下的关键,因为一个狼来了的工具一周之内就会被关掉。模型会读取 imports、追踪数据流、推理一个被标记的模式是否真的可达——这是正则表达式扫描器做不了的判断。入口是 Claude.ai 侧边栏或 claude.ai/security,不需要 API 集成,也不用构建自定义 agent。
实际用起来,发现的问题基本集中在几个类别:未净化输入导致的注入、破损的授权检查、意外提交的密钥、服务端请求伪造、不安全的反序列化。目录定向才是让这些在真实代码库里可操作的关键。你不用扫描一个 20 万行的单体仓库然后被一份报告淹没,而是可以限定范围到刚改过的服务,审查完然后收工。在你还在改动的上下文里就能完成的有限扫描,才是你会真正去读的扫描。
真正让扫描器变成习惯的是两个功能:webhook 和持久化的 dismissal。
Webhook 把结果推送到 Slack、Jira 或任何接受 hook 的地方。扫描结果直接变成工单,不用任何复制粘贴,发现直接出现在团队已经在用的地方而不是没人打开的仪表板。持久化的 dismissal 意味着你审查过并拒绝的发现下次扫描不会重新冒出来——这是老工具最大的疲劳来源。
把它们组合起来就是一个循环。定时扫描、只暴露新发现、路由到团队所在地、用理由忽略噪音、让下次扫描尊重那个选择。这个循环才是工具从"跑一次截图"到"每周五都跑"的全部分水岭。
这同样是它和规则生成式工具拉开差距的地方。Snyk、Dependabot、GitGuardian 擅长匹配已知签名和标记有公开 advisories 的依赖。它们在解释为什么你自己逻辑里的特定代码路径可被利用方面就很弱了,而且倾向于把信号埋在大量 severity 徽章下面。置信度评分加 dismissal 让你能设定一个噪音底线,只有值得花一分钟人类时间关注的发现才会通过。承诺是更少的告警,每个承载更多上下文。
更大的动作是谁在基于它构建。CrowdStrike、Microsoft Security、Palo Alto Networks、SentinelOne、TrendAI、Wiz 都把 Opus 4.7 嵌入到自家安全产品里。服务端这边,Accenture、BCG、Deloitte、Infosys、PwC 在为客户部署 Claude 集成的安全工作流。Anthropic 还开放了 Cyber Verification Program,面向做高风险网络安全工作、需要访问受保护能力的组织。
上周补上了治理这一半。5 月 21 日宣布的 Compliance API(合规性 API)把 Claude Enterprise 和 Platform 的活动(prompts、responses、上传的文件、日志、管理员操作)暴露给外部安全和治理工具。这是安全团队在让任何模型接触生产代码之前必须有的东西,因为没有审计面,模型就是一个合规官签不了字的灰盒。
合作伙伴的消息就算你从来不碰 Enterprise 产品也值得关注。当 Wiz 或 CrowdStrike 把 Opus 4.7 接入你已经跑着的扫描器,模型的推理能力就通过你已经付过钱、已经信任的工具进入了你的流水线。这是更安静的分发故事。不是每个人都会注册 Claude Security,但很多团队最终会在从不离开熟悉仪表板的情况下用到它。
连起来看,这是 Anthropic 在把 Claude 定位成安全厂商构建的底层,而不是和传统巨头赛跑的独立扫描器。这和他们更宏观的网络安全赌注相呼应——模型是引擎,其他公司把产品做在上面。
说点实在的。Claude Security 是 Enterprise 公测。Team 和 Max 访问标注为即将到来,公告里没有 Pro 层级。作为一个人工作室,我暂时没法把它指向我的仓库,这点我不会装。
所以这是我实际用来替代的东西。Claude Code 内置了一个安全审查功能,用 /security-review 命令触发,对 diff 做按需检查,在代码合并前标记问题。还有一个 Claude Code 的 GitHub action,可以自动审查 pull request,把发现作为内联评论留在 PR 上。两个都是给个人开发者现在就能用的,都用同一种方式推理代码,修复都由人类批准。
我的配置很简单。GitHub action 在每个 PR 合并到 main 时运行,评论它发现的任何东西,所以审查在我想起来触发之前就发生了。当我要碰 auth、payments 或任何处理 token 的东西时,先在本地跑一遍 review 命令,读推理过程,而不只是看结论。它能抓住那些无聊但危险的东西:即将被提交的密钥、未转义的查询、缺失的 webhook 签名校验。上个月它拦住了我发布一个没有验证签名头就信任 payload 的 webhook 端点——这种错误在 review 里看起来没问题,在生产环境咬人。是推理过程,而不只是一个标记,让我真正修好而不是糊弄过去。
值得说清楚它不能替代什么。它推理的是你自己的代码,所以它补充而不是取代依赖扫描(已知 advisories)、密钥轮换和真正的安全姿态的其他部分。把它当一个很棒的 reviewer,而不是一个成品。它也不是那个定时运行的、有 webhook 路由的、有 dismissal 追踪的产品。它是同一个能力在 solo 规模下的体现,如果 Team 访问按承诺的那样落地,这些习惯直接迁移过去。
Claude Security 大概一个月从 demo 变成了 workflow。扫描器从来不是难点。定时运行、持久化的 dismissal、能把票据归档的 webhook——这些才让安全工具变成你留着用的东西,而不是跑一次截图的东西。底层模型现在被六家安全平台共享,还有一个治理 API,这比任何一个单一功能都更能说明策略。
现在它卡在 Enterprise 层级后面,所以 solo 开发者通过 Claude Code review 得到同样的引擎。把 GitHub action 接进你的 pull request,在碰任何敏感东西之前跑 review 命令,盯着 Team 和 Max 的进展。等的时候去 Lab 看看其他 Claude coverage。
原文链接:https://dev.to/lab/claude-security-update-scans-webhooks-6-partners-2f8k