爱折腾的工程师

未来的你会感谢现在努力的自己

把『基于 URL 写一篇博文』这条 prompt 救回来:一个 Claude Skill 的设计、打造与三轮评测实录

为什么「基于这个 URL 写一篇博文」这条 prompt 几乎注定塌?prompt-optimizer skill 用 5 维度心智模型 + 5 步工作流把它救回来。本文先讲清楚它从概念构思到定型上线的 4 阶段开发过程、设计动机和实现原理,再把一份完整的双轨评测(质量评测 21/21 vs 4/8、触发评测三轮迭代 F1 0.90 → 1.00、全样本 3/3 全票一致)拆给你看,附 8 张数据信息图。读完你会知道——评测 skill 不只是看分数,更是看分数停在 100% 之后还有什么可以改。

10 人独角兽不再是故事:拆解 Anthropic《创始人手册》里的 AI-native 创业新路线

Anthropic 把 2026 年创业生命周期重映射成 Idea / MVP / Launch / Scale 四阶段,并把『创始人=IC』改写为『创始人=Agent 编排者』。本文从原文 36 页 PDF 中提炼出可执行的策略、容易踩的坑,并结合 Carta Healthcare、Anything、Cogent 等 9 家真实公司的做法,给出图文并茂的深度解读。

Perplexity 的 Agent Skills:一套与 Zen of Python 几乎完全反向的设计哲学

Perplexity 把 Agent Skills 当一等公民来设计、迭代、维护。本文从原文出发,提炼五条反直觉心智模型——Zen of Skills、四属性、三层上下文成本、Description 即路由、Gotchas Flywheel——并结合 U.S. Income Tax Skill 失败案例与 PR 监控 Skill 路由案例,给出可落地的五步构建法、四套 Eval Suite 与一份 7 条带走清单,图文并茂。

HTML 对 Agent 的不合理有效:从文字墙到可操作工件的输出格式革命

Markdown 把空间信息压扁了,HTML 把它还原回来。本文基于 Thariq Shihipar 的 HTML Effectiveness 示例集,提炼 5 类高密度场景(探索规划 / 代码评审 / 设计原型 / 一次性编辑器 / 教学解释),解析「视觉呈现 → 在空间中决策 → 导出回 prompt」的反馈循环,并给出 Agent 输出格式选型决策树与对 Claude Code、CodeBuddy、Cursor、Devin 等主流形态的影响推断。

Computer Use 工程化指南:拆解 Anthropic 官方《Best Practices》里的 6 条主线

Anthropic 在 2026 年 5 月发布的《Best practices for computer and browser use with Claude》,把 Computer/Browser Use 落地最难的 6 件事一口气说透:分辨率与坐标、思考强度、Prompt Injection 防御、上下文管理、Batch/Advisor 实验工具、Teach Mode 演示回放。本文把这 6 条主线提炼成可直接抄走的工程清单,并配 8 张信息图。