Marico's space
首页
我的日志
我的游记
世界·视野
编程技术
Marico's space
首页
我的日志
我的游记
世界·视野
编程技术
技术合作:
look@marico.cc
+86 18660050334
loading...
产品图片流水线中 VLM 步骤的语义缓存
6-4 20:56
最近折腾了产品图片流水线上的视觉语言模型调用优化,踩了几个坑,这篇把问题说清楚。 先说结论:在 VLM(视觉语言模型)步骤前加了 Bifrost 做语义缓存,三周内把账单砍了 62%。GPU 那边的 diffusion 生成从来就不是该操心的地方。 账单让人意外 Photoroom 的流水线处理每张产品图要三步。第一步,VLM 读图生成结构化描述。第二步,另一个 LLM(大语言模型)把用户
Claude 安全更新:扫描、Webhook、6 家合作伙伴
6-4 17:34
最近把 Claude Security 折腾了一遍,踩了几个坑,这篇把问题说清楚。 一个月前 Claude Security 公测的时候,说实话更像是一个包装精致的扫描器,而不是一个能日常使用的工作流。你丢一个仓库给它,它像个安全研究员一样推理论证代码,然后甩出一堆发现和建议补丁。有用,但不好用。这周在 Claude.ai 侧边栏看到的版本完全是另一回事了。定时扫描、Slack 和 Jira 的
每日一开源项目(第77期):notebooklm-py - 将 Google NotebookLM 变成可编程 API,支持 Claude Code 集成
6-4 14:49
最近折腾了一下 notebooklm-py,把 Google NotebookLM(谷歌的智能笔记工具)变成了可编程的 API,还顺手接入了 Claude Code,整个过程踩了几个坑,这篇把核心东西说清楚。 Google NotebookLM 是目前最强的个人知识 + AI 问答工具之一:上传文档,它自动摘要、生成播客、做 PPT、回答问题还能标注来源。但有一个致命缺陷:没有官方 API。所有
我的开源安全扫描工具被 Windows Defender 标记为 Trojan
6-4 11:27
最近折腾了一个 MCP 服务器的安全扫描工具。结果上线第一周,Windows Defender 就直接把它当成了木马,默默从用户机器上删掉了。 它根本不是恶意软件。VirusTotal 上 71 个杀毒引擎里只有 1 个报毒——就微软一家。 这篇文章说说到底发生了什么、为什么 Go 编译的二进制文件特别容易踩这个坑,以及我是怎么解决的,免得大家跟我一样栽跟头。 产品背景 MCPSense
PostgreSQL WAL 膨胀:为何自动管理常不够用?
6-3 20:55
最近维护一套生产环境的 ERP(企业资源计划)系统,遇到了一个让人措手不及的问题——数据库磁盘空间在飞速增长。凌晨3点14分收到告警,说磁盘使用率已经飙到了95%。查了一圈发现,是 PostgreSQL 的 WAL(预写日志)目录出现了异常膨胀。这就是 WAL(预写日志)膨胀的问题,处理不好会严重影响系统性能,甚至导致数据丢失。 深入分析根本原因后,我发现 PostgreSQL 自带的 WAL
Google I/O 2026 最亮眼的开发者发布不是模型,而是运行时:Gemini API 托管代理
6-3 17:34
每年 Google I/O 都会有一堆重磅发布:大模型、新能力、让开发者又兴奋又焦虑的新功能。Google I/O 2026 当然也不例外。Gemini 3.5 Flash 在基准测试里杀疯了,WebMCP 让开源社区有了新的辩论话题,AI Studio、Chrome、Search、Gemini 全都在往智能代理(Agent)方向狂奔。 但我真正觉得值得所有开发者关注的发布,不是声量最大的那个。
模型不是产品:本地 Gemma 4 构建经验
6-3 14:49
最近折腾了本地 Gemma 4,踩了几个坑,这篇把问题说清楚。 用能力不错的本地模型时,最容易犯的错误是把模型调用当成整个应用。 我在用 Gemma 4 E2B 开发项目时差点就犯了这种错误。 我的项目是一个本地老年痴呆症护理助手,叫 RememberMe CareGrid。产品目标不是做一个听起来很聪明的聊天机器人,而是帮助一位困惑的患者获得平静的上下文信息,帮助护理人员理解发生了什么,帮
Gemini API 托管 Agent 快速上手——从 Prompt 到部署的最快路径
6-3 11:28
Google I/O 2026 发布了大量开发者工具,我最想实际用的是 Gemini API 的托管 Agent。 核心卖点很简单:一次 API 调用就能搞定一个完整功能的 Agent,带远程执行沙箱。不用搭基础设施,不用管云服务器,不用手动配置 Antigravity agent 框架。你只管写 Agent 逻辑,剩下的环境配置 Google 全包了。 这篇文章聊聊托管 Agent 到底是什
💰 那个让我一周赚了18,000美元的Claude提示词
6-2 17:33
一个提示词,七天时间,一万八千美元。这篇把完整的操作流程、那个提示词本身、踩过的坑、以及为什么它真的管用,全部摊开说清楚。 那封改变一切的消息 事情发生在周二。那天我正喝着第三杯咖啡,一条微信消息弹了出来——发消息的是一位在技术论坛上见过一次面的创业者: > "我们的AI辅助功能现在一团糟,用户反馈很差。能不能帮忙做个技术审计,帮我们看看问题出在哪?预算不是问题。" 按照往常的习惯,我大
Morph:AST 级重构,LLM 描述意图而非代码
6-2 14:50
最近折腾了一个 LLM(大型语言模型)驱动的代码重构工具 Morph,踩了几个坑,这篇把问题说清楚。 平时用 LLM 做代码重构,输出的是一个 diff,reviewer 只能一行行读、盲信模型。你根本没法知道模型是不是漏了某个引用、搞坏了 import,或者悄悄改了什么逻辑——除非一行行把代码看完。 Morph 换了个思路。它不要求 LLM 生成代码,而是让 LLM 用结构化的类型化操作计划
共 217 条, 共 22 页
第
1
2
3
...
22
页