编程技术 - Marico's space

产品图片流水线中 VLM 步骤的语义缓存

6-4 20:56

最近折腾了产品图片流水线上的视觉语言模型调用优化，踩了几个坑，这篇把问题说清楚。先说结论：在 VLM（视觉语言模型）步骤前加了 Bifrost 做语义缓存，三周内把账单砍了 62%。GPU 那边的 diffusion 生成从来就不是该操心的地方。账单让人意外 Photoroom 的流水线处理每张产品图要三步。第一步，VLM 读图生成结构化描述。第二步，另一个 LLM（大语言模型）把用户

Claude 安全更新：扫描、Webhook、6 家合作伙伴

6-4 17:34

最近把 Claude Security 折腾了一遍，踩了几个坑，这篇把问题说清楚。一个月前 Claude Security 公测的时候，说实话更像是一个包装精致的扫描器，而不是一个能日常使用的工作流。你丢一个仓库给它，它像个安全研究员一样推理论证代码，然后甩出一堆发现和建议补丁。有用，但不好用。这周在 Claude.ai 侧边栏看到的版本完全是另一回事了。定时扫描、Slack 和 Jira 的

每日一开源项目（第77期）：notebooklm-py - 将 Google NotebookLM 变成可编程 API，支持 Claude Code 集成

6-4 14:49

最近折腾了一下 notebooklm-py，把 Google NotebookLM（谷歌的智能笔记工具）变成了可编程的 API，还顺手接入了 Claude Code，整个过程踩了几个坑，这篇把核心东西说清楚。 Google NotebookLM 是目前最强的个人知识 + AI 问答工具之一：上传文档，它自动摘要、生成播客、做 PPT、回答问题还能标注来源。但有一个致命缺陷：没有官方 API。所有

我的开源安全扫描工具被 Windows Defender 标记为 Trojan

6-4 11:27

最近折腾了一个 MCP 服务器的安全扫描工具。结果上线第一周，Windows Defender 就直接把它当成了木马，默默从用户机器上删掉了。它根本不是恶意软件。VirusTotal 上 71 个杀毒引擎里只有 1 个报毒——就微软一家。这篇文章说说到底发生了什么、为什么 Go 编译的二进制文件特别容易踩这个坑，以及我是怎么解决的，免得大家跟我一样栽跟头。产品背景 MCPSense

PostgreSQL WAL 膨胀：为何自动管理常不够用？

6-3 20:55

最近维护一套生产环境的 ERP（企业资源计划）系统，遇到了一个让人措手不及的问题——数据库磁盘空间在飞速增长。凌晨3点14分收到告警，说磁盘使用率已经飙到了95%。查了一圈发现，是 PostgreSQL 的 WAL（预写日志）目录出现了异常膨胀。这就是 WAL（预写日志）膨胀的问题，处理不好会严重影响系统性能，甚至导致数据丢失。深入分析根本原因后，我发现 PostgreSQL 自带的 WAL

Google I/O 2026 最亮眼的开发者发布不是模型，而是运行时：Gemini API 托管代理

6-3 17:34

每年 Google I/O 都会有一堆重磅发布：大模型、新能力、让开发者又兴奋又焦虑的新功能。Google I/O 2026 当然也不例外。Gemini 3.5 Flash 在基准测试里杀疯了，WebMCP 让开源社区有了新的辩论话题，AI Studio、Chrome、Search、Gemini 全都在往智能代理（Agent）方向狂奔。但我真正觉得值得所有开发者关注的发布，不是声量最大的那个。

模型不是产品：本地 Gemma 4 构建经验

6-3 14:49

最近折腾了本地 Gemma 4，踩了几个坑，这篇把问题说清楚。用能力不错的本地模型时，最容易犯的错误是把模型调用当成整个应用。我在用 Gemma 4 E2B 开发项目时差点就犯了这种错误。我的项目是一个本地老年痴呆症护理助手，叫 RememberMe CareGrid。产品目标不是做一个听起来很聪明的聊天机器人，而是帮助一位困惑的患者获得平静的上下文信息，帮助护理人员理解发生了什么，帮

Gemini API 托管 Agent 快速上手——从 Prompt 到部署的最快路径

6-3 11:28

Google I/O 2026 发布了大量开发者工具，我最想实际用的是 Gemini API 的托管 Agent。核心卖点很简单：一次 API 调用就能搞定一个完整功能的 Agent，带远程执行沙箱。不用搭基础设施，不用管云服务器，不用手动配置 Antigravity agent 框架。你只管写 Agent 逻辑，剩下的环境配置 Google 全包了。这篇文章聊聊托管 Agent 到底是什

💰 那个让我一周赚了18,000美元的Claude提示词

6-2 17:33

一个提示词，七天时间，一万八千美元。这篇把完整的操作流程、那个提示词本身、踩过的坑、以及为什么它真的管用，全部摊开说清楚。那封改变一切的消息事情发生在周二。那天我正喝着第三杯咖啡，一条微信消息弹了出来——发消息的是一位在技术论坛上见过一次面的创业者： > "我们的AI辅助功能现在一团糟，用户反馈很差。能不能帮忙做个技术审计，帮我们看看问题出在哪？预算不是问题。" 按照往常的习惯，我大

Morph：AST 级重构，LLM 描述意图而非代码

6-2 14:50

最近折腾了一个 LLM（大型语言模型）驱动的代码重构工具 Morph，踩了几个坑，这篇把问题说清楚。平时用 LLM 做代码重构，输出的是一个 diff，reviewer 只能一行行读、盲信模型。你根本没法知道模型是不是漏了某个引用、搞坏了 import，或者悄悄改了什么逻辑——除非一行行把代码看完。 Morph 换了个思路。它不要求 LLM 生成代码，而是让 LLM 用结构化的类型化操作计划