AI Blog
← 返回首页
AI tools · code assistant · workflow

Codex APP 保姆级全攻略:从安装到电脑自动化全覆盖

如果你还在 Claude Code 和 Codex 之间犹豫,这里有一个关键对比:Codex APP 比起 Claude Code,额度更高、功能更全,免费账户也能用,而且不会出现限速、封号、降智等问题。

以下是一份完整的 Codex APP 上手指南,覆盖安装、沙箱权限、画图、计划模式、代码管理、云端模式、记忆系统、插件自动化、Skills、MCP 以及电脑自动化等全部功能模块。

一、基础使用

Codex APP 以"项目"为单位管理你的工作。每个项目是一个独立的文件夹,所有相关的对话和文件修改都归在这个项目下。

任务管理非常直观——左侧任务栏可以清晰观察多个任务的运行状态:

多任务并行是 Codex 的一大特色。你可以同时开启多个任务,在不同的项目文件夹里并行工作,需要时自由切换。

对话标题由 AI 根据内容自动摘要生成,支持手动重命名和归档。已归档的对话可以在设置中找到并还原。

二、权限体系与沙箱

这是 Codex APP 与同类工具最本质的区别。

沙箱机制

Codex 会把当前项目文件夹作为一个"沙箱"来管理。默认权限下,Codex 可以直接读写沙箱内的所有文件,不需要逐个审批。

沙箱有两个硬性限制:

  1. 不能修改沙箱外的文件
  2. 默认禁止联网

这两个限制不是靠模型自觉遵守,而是通过操作系统底层的安全机制实现的(Windows 用 AppContainer,macOS 用 Seatbelt 等)。这个设计体现了 Harmony(马具) 的核心理念——AI 就像一匹能力很强的马,沙箱权限和审批机制就是约束它的马具。

权限三档

上下文管理

右上角展示当前上下文的用量。超过限制时,Codex 会自动压缩对话历史。但有一个经验:清空好于压缩。完成一个任务后建议开新对话,让 AI 的注意力集中在新的任务上。

三、画图能力

Codex 内置 AI 画图功能,使用的是 GPT Image 2 模型。

一个实际案例:生成宠物店网站配图时,Codex 最初使用了不合适的免费网络素材。使用 STEER(引导) 功能在运行中即时纠正方向,最终 Codex 成功调用了 AI 生图能力,生成了三张风格一致的店内环境轮播图,以及一张带店铺位置标注的可爱风格地图。

STEER 功能非常实用——当发现 AI 执行过程中理解出错时,可以"打方向盘",即时接管并引导 AI 回到正确方向。

四、计划模式

开启计划模式后,Codex 不会立即执行操作,而是先输出一份完整的工作计划。

在计划模式下,Codex 倾向于使用"问题卡片"与用户沟通,逐个确认需求细节。确认后点击"实施计划",Codex 开始编码,然后启动内置渲染器进行自动化测试。

配合内置渲染器,还可以在页面上直接做批注——选中某个元素、添加评论,AI 就会在下方实时展示修改过程。

五、代码管理

Codex APP 不是一个传统的 IDE,不提供完整的代码编辑功能。可以通过第三方 IDE(如 VS Code)来修改代码。

只需要把项目初始化成 Git 仓库,右上角就会出现 VS Code 按钮一键打开。

Git 操作

可以用对话的方式完成所有 Git 和 GitHub 操作。两个进阶技巧值得注意:

Git 回滚(Fork):在需要回滚的位置点 Fork,选择应用到本地,可以将对话历史恢复到那个点。配合 VS Code 的 Git 操作,从代码层面对话层面进行全面回滚。

Git Worktree(工作树):用 Git 创建一个新分支,把分支代码复制到一个独立的文件夹里。主文件夹和分支文件夹可以并行工作、互不干扰。开发完成后合并回主干就行。

六、云端模式

Codex 任务除了在本地运行,还可以在云端运行。

前提是把代码全部同步到 GitHub,然后在运行模式中选择"关联 Codex Web"。效果是——在手机浏览器上也能打开 Codex Web,让它在云端运行环境里完成工作,你只需要在手机上审批即可。

最适合的场景:出门在外手头没有电脑时,用手机控制 Codex 完成开发任务。

七、记忆系统

Codex 提供了两种记忆方式解决"每次新对话都要重新交代项目背景"的问题:

项目级记忆:AGENTS.md

在项目根目录创建 AGENTS.md 文件(Claude Code、OpenCode 等工具通用),后续所有对话都会自动带上这个文件作为上下文。

可以让 Codex 帮你编写这个文件——让它通读当前文件夹,把学到的知识保存到 AGENTS.md。

全局记忆:自定义指令

在 Codex 设置 → 个性化 → 自定义指令编辑,对所有项目生效。

实际案例:可以加上"禁止使用脚本批量删除文件或目录,只能一个文件一个文件地删除"这样的全局约束。实测中 Codex 会严格遵守。

八、插件与自动化

Codex 的插件市场有两类:插件(第三方服务软件包)和 Skills

一个完整的插件实测流程:

  1. 安装 GitHub 插件 + Gmail 插件
  2. 让 Codex 查询 GitHub 上 Star 数量前 10 的开源项目
  3. 用 Gmail 发邮件自己做摘要
  4. 将上述工作做成自动化任务,每周五下午 4 点自动执行
  5. Codex 还会自动写入 MEMORY.md 文件记录经验,帮助下次执行得更准确

自动化任务可以编辑执行频率(每周/每天/每小时)、使用的模型,还支持实时运行测试。

九、Skills(技能系统)

Skills 是给 AI Agent 的专业技能包。可以把工作流、专业能力、规范封装成 Skill 交给 AI,让执行更稳定、更高效。

三种获取方式

实战案例:文字转 PPT

安装第三方 PPT Skill 后,输入一段文案,Codex 会自动生成网页版 PPT,排版得当、重点突出、加入高级动效,直接可以拿来上台演讲或录制视频。

实战案例:视频转图文教程

使用 Skill Creator,把"视频字幕 → 图文教程"的工作流固化为 Skill。流程是:读取字幕转 Markdown → 添加标点、划分段落 → 在关键位置插入截图占位符 → 截图替换。最终输出图文并茂的教程笔记。

十、MCP(模型上下文协议)

MCP 是 AI 大模型的标准化工具箱——大模型可以通过它与外界交互、获取信息、完成具体任务。

实操案例:用 MCP 给项目接入 Supabase 数据库。

  1. Supabase 创建项目 → 获取 MCP URL
  2. Codex 设置 → MCP 触发器 → 添加服务器
  3. 授权完成后重启 Codex
  4. 一句话让 Codex 创建数据库表

Codex 自动完成了:创建表 → 后端加入 PostgreSQL 连接池 → 修改前端表单 → 配置连接地址。在浏览器中填表单提交后,Supabase 中就能看到数据成功写入。

项目部署:Netlify

安装 Netlify 插件,一句话即可将项目部署到 Netlify,获得公网可用的域名,且在国内可直接访问。

十一、电脑自动化(Computer Use)

目前仅限 Mac 电脑使用。安装插件后,Codex 可以在后台用虚拟鼠标自动操作电脑。

场景一:发消息 — 让 Codex 打开聊天软件、找到联系人、发送消息。它会在后台自动完成操作,询问确认后再发送。

场景二:看板进度汇总 — 给 Codex 一个团队进度看板的 URL,它会申请浏览器权限,在后台用虚拟鼠标打开 Chrome,查看所有进度,做英文版简报,然后发送给老板。

整个过程在后台自动运行,不占用当前窗口。而且可以做成定时任务——每天下午 5 点自动执行,不需要人工介入。

总结

Codex APP 的几大核心亮点: