site logo

Marico's space

把 NestJS 部署到 AWS Lambda 上跑 API Gateway,听起来挺简单的——直到你开始真正把它们串起来。 从让 NestJS 适配无服务器(Serverless)运行环境,到配置 API 网关(API Gateway),再到用 AWS CDK(云开发工具包)搭建基础设施,这里面有好几个环节容易乱成一锅粥。自己做个人项目的时候,这些坑我一个不落全踩了一遍——尤其是怎么让 Nes
最近折腾 HPC 集群存储方案,踩了几个坑,这篇把 NFS 和并行文件系统的选择问题说清楚。 搭建或扩展 HPC 集群时,存储设计是最大的架构决策之一。很多中小规模集群起步选择 NFS,简单、可靠、好维护。但随着业务增长,存储往往成为隐藏的性能瓶颈。 所以真正的问题是: 什么时候 NFS 就够了,什么时候其实需要 Lustre、BeeGFS 这类并行文件系统? 这篇文章拆解几个实际影响因素
最近在折腾 AI 编程工具,发现一个很现实的问题:这些 Agent 们写代码确实快,但普遍喜欢"抄近路"——跳过需求确认、跳过测试、跳过代码审查,怎么省事怎么来。今天聊的这个项目,就是来解决这个问题的。 这是"每日一开源项目"系列的第 58 篇,今天聊聊 Agent Skills。 如果说上期介绍的 Symphony 解决的是"如何大规模运行 AI Agent",那 Agent Skills
别让SSD性能腐烂:Linux上实用的fstrim.timer 如果你的Linux系统运行在SSD、由SSD存储支持的虚拟磁盘或精简配置卷上,TRIM是那种容易被遗忘、日后调试又很麻烦的无聊维护任务。 好消息是,现代Linux已经有了一个明智的解决方案:fstrim.timer。 本文展示如何: * 验证discard是否真正被支持 * 检查fstrim.timer是否已启用 * 安
最近折腾 AI Agent 编排,踩了几个坑,这篇把问题说清楚。 过去一周,GitHub Trending 和 HN 上最火的话题不是新的模型发布,而是 AI Agent 基础设施: * Superset — HN 96票,Cursor 式的并行 Agent 编排工具 * Kontext CLI — HN 70票,AI Agent 的凭证中间件 * JACoB — HN 40票,真实生产
最近折腾了一个叫 SwiftDeploy 的部署工具,踩了不少坑,这篇把核心设计说清楚。这个工具解决的是一个老问题:部署流程里的配置、策略、监控三个东西本来应该紧耦合,结果在大多数项目里都是散的——Compose 文件一套、Env 文件一套、CI 里再一套,改一个阈值要改好几个地方。SwiftDeploy 用一个 manifest.yaml 把这三件事闭环了,底层靠 OPA(Open Policy
最近AI Agent开发领域有个有趣的现象:教程和框架几乎清一色是Python,但真正跑在生产环境里的基础设施,却越来越多人悄悄换成了Go和Rust。这种语言选择的割裂感,其实反映了AI Agent项目天然的架构分层需求——不同层级对性能、可靠性和开发效率的要求完全不同。 本文不会告诉你「某某语言最好」,而是帮你搞清楚在AI Agent系统的不同位置,到底该用什么语言。有具体项目案例,也有代码片
说起来,最近 AI(人工智能)模型的托管和部署已经成为 DevOps 领域最热门的话题之一。我之前做过一段时间的云原生基础设施相关工作,对 Kubernetes(简称 K8s)在生产环境中的应用还算熟悉。今天要聊的这两家平台——Replicate 和 Modal——算是目前 AI 模型托管领域比较有意思的存在。一个走的是「傻瓜式」路线,用 Cog 把模型打包成标准化容器;另一个则是代码优先,把 P
最近一直在看各种 AI Agent(人工智能智能体)方向的 PMF(产品市场契合度)提案,发现大多数都掉进了同一个坑里——听起来挺有用,但本质上都是"更便宜的研究"、"更便宜的监控"或者"更便宜的内容生成"。说实话,看多了有点审美疲劳。直到读到这篇关于医疗账单索赔冻结的提案,眼前一亮,觉得找到了一个真正有嚼头的切入点。 作者瞄准的不是什么高大上的认知智能,而是医疗运营里最让人头疼的"记录漂移"问
说实话,我第一次在自己的项目里接入 Google OAuth 的时候,被文档绕得有点晕。Google 的文档确实很全,但信息密度太大,很多关键细节埋得很深,比如为什么非得用 PKCE、access_type=offline 和 prompt=consent 这两个参数到底起什么作用。网上很多教程要么只讲一半,要么直接跳过了 refresh_token 这个环节,导致 token 过期后应用直接挂掉
共 174 条, 共 18 页