摘要:最近不少开发者从其他AI编程工具转向了 OpenAI Codex,但很多人依然把它当成“终端版的ChatGPT”来用,结果频频翻车。其实,OpenAI官方早就给出了一份极其硬核的最佳实践指南。本文将结合官方指南与一线实操经验,带你重构对 Codex 的认知——它不是一次性助手,而是需要持续配置和磨合的虚拟队友。从Prompt怎么写、AGENTS.md怎么配,到MCP外脑接入、Skill技能封装,帮你彻底跑通 Codex 的工程化闭环。
最近圈子里刮起了一阵“转码风”——不少朋友从别的AI编程工具转向了 OpenAI 的 Codex。但很多人私信问我:“为什么我用 Codex,它要么一顿瞎改,要么就在终端里疯狂问我确认?”
其实,这真不能怪工具。大部分人还在用“聊天机器人”的思维来使唤 Codex,这就好比招了个资深工程师,却只让人家帮你回邮件。
OpenAI 官方有一份含金量极高的 Codex 最佳实践文档,如果你没耐心啃英文,今天就跟着我把这套“驯服 Codex”的9步心法彻底盘明白。顺便说一句,如果你还没装 Codex,Mac 用户的体验目前是最丝滑的,直接去 chatgpt.com/codex 下载即可。

一、对齐频道:把话说清楚,别让它猜
Codex 的底座能力已经很强了,哪怕你随便扔一句话,它也能给你蹦出点代码。但在大型项目里,“能用”和“好用”是两码事。很多时候 Codex 瞎改乱改,根本原因是你没给够上下文。
1. 提示词的四要素结构
别再写“帮我优化一下这段代码”这种神仙Prompt了。一个靠谱的指令必须包含四个模块:
目标:你要干什么?(比如:修复用户详情页白屏问题)
上下文:跟哪些文件有关?(强烈建议用
@符号精准提及文件,比如@UserService.cs,这能大幅减少 token 消耗和 AI 的幻觉)约束条件:底线是什么?(比如:不许改接口协议,不许引入新依赖)
完成标志:怎么算搞定?(比如:相关测试用例全部跑通,bug不复现)
2. 复杂任务?先做规划!
面对模糊或大块的任务,千万别让它直接写代码,很容易写到一半拉不回来。你有三种姿势可以选:
Plan 模式:最无脑也最稳。在对话框里敲
/plan或按Shift + Tab,Codex 会先收集信息、向你提问,制定出完善计划后再动手。反向采访:如果你自己都没想清楚,直接告诉它:“请向我提问,挑战我的假设。”把模糊的想法逼成具体需求。
PLANS.md 模板:适合超复杂的多步骤工作流,用模板框住它的发散思维。
二、立规矩:好队友都是调教出来的
如果你每次都要在 Prompt 里重复“我们项目用的是 pnpm,测试命令是 npm run test”,那你不仅累,Codex 也容易忘。聪明的做法是把规矩写进它的“员工手册”里。
3. 把常说的话沉淀进 AGENTS.md
你可以把 AGENTS.md 理解为面向 AI Agent 的 README,它会在每次对话时自动加载到上下文中。一份好用的 AGENTS.md 应该包含:
仓库结构与核心目录
构建、测试、Lint 的具体命令
代码规范与 PR 要求
禁忌操作(比如“绝不修改数据库迁移文件”)
新手可以直接在终端运行 /init 命令,它会扫描当前目录帮你生成一个基础的 AGENTS.md。另外,这个文件支持多层级:~/.codex/AGENTS.md 管全局默认,项目根目录管团队共享,子目录管局部规则,越具体优先级越高。
保持简洁也很关键,别把它写成流水账。如果 Codex 连续犯两次同一个错,让它自己复盘,然后更新 AGENTS.md。
4. 用配置锁死行为一致性
除了规矩,还得有硬性的系统配置。很多你以为的“Bug”,其实都是配置没设对。核心配置文件是 ~/.codex/config.toml(个人默认)和 .codex/config.toml(仓库级)。
这里有两个保命设置:
审批模式:新手千万别一上来就图爽用
full-auto。默认的 Suggest 模式下,Codex 只能看不能动,改任何文件都要你点头。等你熟了,再用auto-edit甚至放开full-auto。沙箱模式:决定它能读写哪些目录。刚起步时权限卡紧点,后面再按需放开。
值得一提的是,ChatGPT Plus 订阅已经包含了 Codex 的使用权益,但千万别搞混了:API 计费和 Plus 订阅是两套独立的体系,你买了 Plus 不代表 API 也有免费额度。个人玩家直接用 ChatGPT 账号 OAuth 登录最省事。
三、干活要闭环:不仅要改代码,还得懂自测
用 AI 写代码最怕什么?改了东墙塌西墙。所以千万别让 Codex 只停留在“生成代码”这一步,你得逼着它完成闭环。
5. 让它测试并审查自己的代码
改完代码只是第一步,你还得要求它:编写测试、跑一遍测试套件、检查 Lint、确认行为无误,最后再审查一遍 Diff。
在 Codex 应用里,你可以直接呼出 Diff 面板,对着某一行代码吐槽,你的反馈会立刻进入下一轮上下文。如果你在 AGENTS.md 里挂载了团队的 code_review.md,Codex 甚至能按你们团队的规范来 Review 代码。
如果你用 GitHub Cloud,还能设置 Codex 自动审查 PR。据 OpenAI 自己说,他们内部现在 100% 的 PR 都会过一遍 Codex 的审查。
6. 用 MCP 接上外部大脑
有时候 Codex 需要的信息不在代码库里,比如线上报错日志、某个第三方库的最新文档。这时候就轮到 MCP(模型上下文协议) 出场了。
MCP 可以让 Codex 直连外部工具,不用你再复制粘贴实时信息。去应用的“设置 -> MCP 服务器”里,你能看到各种推荐服务。比如接入 Context7 提供最新文档防幻觉,或者接入 Serena 做语义级检索。不过,加工具要克制,从一两个最痛的痛点开始,别把它插成了刺猬。
四、解放双手:把重复劳动变成肌肉记忆
当你的 Codex 已经能在你的项目里熟练搬砖时,下一步就是把它的潜力最大化,让它真正融入你的工程流。
7. 把复用工作流打包成 Skill(技能)
如果你发现自己一直在复用同一段长 Prompt,或者反复纠正同一个工作流,那就是时候把它封装成 Skill 了。Skill 本质上就是一套打包好的指令和上下文逻辑,存在 SKILL.md 里,CLI、插件和应用通用。
你可以用 /skill-creator 快速起头。记住,一个技能只做一件事,先让典型任务跑通,再慢慢加戏。个人技能放 $HOME/.agents/skills,团队技能放仓库的 .agents/skills 目录,新人 clone 下来直接就能用。
8. 稳定流程交给自动化
一旦某个工作流变得极其稳定且可预测,你就可以在 Codex 应用的“自动化”标签页里,设定时间表让它在后台定时跑。比如:汇总近期提交、扫描潜在 Bug、起草发布说明等。
记住一个分界线:Skill 定义方法,Automation 定义时间表。如果你自己带着跑都还时不时翻车,那就别急着自动化,先做成 Skill 调教稳了再说。
9. 管理好长线程:别让上下文爆炸
Codex 的一个会话就是一个积累了上下文的工作线程。如果线程太长,AI 会渐渐“失忆”或走偏。在 CLI 里,你可以用 /compact 强制压缩早期上下文生成摘要;如果工作内容发生了真正的分叉,用 /fork 分叉出新线程,而不是在一个线程里聊所有事。
如果是桌面应用用户,强烈建议配合 Git Worktree 使用,让多个 Agent 在独立的分支上并行狂奔,互不干扰,这才是 Codex 的终极形态。
五、新手必看的血泪误区
看了这么多,最后给你排排雷。以下是刚上手 Codex 最容易踩的坑:
把规矩写在 Prompt 里,而不沉淀到 AGENTS.md:每次都要重新念一遍经,累不累?
没告诉它怎么构建和测试:它连自己写的代码对不对都不知道,只能盲人摸象。
复杂任务跳过规划直接干:返工率 99%。
刚认识就给最高权限:
full-auto模式下删库跑路只要一秒钟。不用 Worktree 就在同批文件上并行开会:代码冲突会让你怀疑人生。
工作流还不稳就搞自动化:这叫“自动化地制造灾难”。
像监工一样盯着它敲回车:给它上下文,给它规则,然后让它并行工作,别微观管理。
用好 Codex,本质上是一场工程习惯的升级:上下文给足,规矩写进文件,重复的做成工具,稳定的交给自动化。当你习惯了这种协作方式,你会发现你已经回不去那个纯手敲代码的时代了。