site logo

Marico's space

最近折腾 ClickHouse® 部署,在安全这块踩了几个坑。默认安装跑起来是快,但说实话,生产环境直接用就跟裸奔差不多。查了一圈资料,把安全加固的路子摸清楚了,这篇把核心要点说清楚。 为什么数据库安全不能忽视 ClickHouse® 跑着 BI 看板、监控系统、财务报表、IoT 数据分析这些业务,里头全是敏感信息——客户数据、财务记录、运营指标、商业机密。安全没做好,数据泄露、恶意访问、服
半年前,半夜两点我在线上修bug。我们的API响应时间已经飙到3.2秒,用户在群里炸锅,数据库CPU打满快要冒烟了。组里一个刚入职的小兄弟出的主意是:"要不加台配置更高的服务器?" 那天晚上我悟出一个道理:给一辆轮胎没气的车换大排量发动机,能跑快才怪。真正的问题几乎永远是缓存——但不是你从StackOverflow搜到的第一种解法那种缓存。 下面是真正有效的方案,按效果排序。 1. API
打开 CI 日志,想搞清楚为什么一个 PR 跑了 9 分钟才变绿。本地测试明明只需要 40 秒。翻到上面一看,罪魁祸首:覆盖率任务。同样的测试用例,只是套了个 Xdebug,每个断言都像爬一样。 大多数团队从来不把这两个数字拆开看。看到"测试耗时 9 分钟",就以为是测试本身慢。其实不是。慢的是覆盖率驱动。而且修复方法只是 CI 配置里改一行代码,但几乎没人做过,因为根本没想过要去测一下时间到底
很多团队的开发工作止步于"能跑就行"。Jira tickets 关闭了,功能上线了,就万事大吉。但对于真正的工程师来说,这只是起点——真正的挑战在于代码不再只是文本,而是开始与基础设施产生真实的交互那一刻。 我决定开一个 ENGINEERING 专栏,因为我坚信:性能不是上线前临时抱佛脚的"调优",也不是在死线前慌慌张张加个缓存。性能是架构的根基。 为什么要聊这个? * 开发经济学:一个
最近折腾了自己的作品集(Portfolio)网站,踩了几个坑,总结出一套实用的优化思路。加载速度、SEO排名、日常维护,这三个问题搞定了,网站才能真正为你服务,而不是成为需要你伺候的累赘。下面直接说干货。 1. 先选个轻量级技术栈 性能优化的最大收益,其实在你写第一行代码之前就决定了。 * 技术栈要精简。静态站点生成器(Astro、Next.js 静态导出、Hugo,甚至纯 HTML/C
最近折腾 AI Agent 的长期记忆系统,踩了几个坑,这篇把问题说清楚。 一开始大家都觉得长期记忆必须得上向量数据库,得搭 RAG 管道。但看了一圈真正扛住大流量的 Agent 产品,发现它们不约而同选了更简单的方案:纯文本文件。 这不是技术退步,反而是个更强的工程选择。文件可追溯、可对比、可迁移,还能直接 Git 版本管理。 不过光有一堆文本还不够,想让这种方案真正 work,必须把存储
最近折腾多智能体系统,踩了几个坑,这篇把问题说清楚。 从单智能体LLM(大语言模型)方案切换到多智能体系统(Multi-Agent Systems,MAS),这事大多数时候是被逼出来的,不是你主动选择的。企业需求一膨胀,做过单智能体的都知道那套"瑞士军刀"式架构有多难受——工具调疲劳、幻觉率飙升、长流程状态根本管不住。 但话说回来,上多智能体架构也不是银弹。它引入的是一整套分布式系统的新问题:
几乎所有"手把手教你构建AI Agent"的教程,结尾都是同一个套路:模型调用工具,工具返回数据,模型用数据回复。演示效果拔群。 但教程没告诉你的是:工具超时了怎么办?模型连续三次调用同一个工具怎么办?模型调用了一个有副作用的工具但用户根本没这个意图怎么办?工具返回了错误但模型还是硬编了一个答案怎么办? 这些不是边缘情况——这就是生产环境Agent的日常。分享五个我在每个上线的Agent里都会
最近给几个项目加了生物识别认证,踩了几个坑,顺手把正确的实现方式整理一下。这玩意儿看着简单,真正跑起来会发现一堆细节没处理到位,尤其是跨平台(安卓/iOS)的时候。 这篇文章不整那些花里胡哨的理论,直接上生产级代码和避坑指南。 为什么要用生物识别认证 先把价值说清楚,不然没法说服产品和老板: * 登录体验快,不需要输入密码 * 比传统密码认证更安全,指纹和面部信息难以伪造 * 安卓
最近折腾了一波 Apple HealthKit 和 Google Health Connect 的数据集成,踩了几个坑,这篇把问题说清楚。现在智能穿戴设备越来越卷,手环、手表天天往云端吐数据,怎么把这些乱七八糟的原始数据变成医院和保险能认的标准格式,是这行的核心技术挑战。 用 Go 做健康数据后端是个香饽饽——天然的高并发、低延迟,特别适合处理海量的可穿戴设备上报。接下来的内容,我会手把手带你设
共 290 条, 共 29 页