Codex + 剪映自动化剪辑实战：jianying-editor 安装教程与口播视频工作流搭建

codex编辑2026-06-22 13:02:1970

摘要：本文系统讲解如何用 Codex 安装 jianying-editor Skill，搭建一条"Codex 生成文案与素材 → Python 写入剪映草稿 → 人工精修导出"的自动化剪辑工作流。涵盖 Skill 安装、小环测试、正式口播视频制作全流程，并对比 Remotion、HyperFrames、JianYingApi、VectCut 等主流方案的差异，帮助内容创作者根据自身需求选择最合适的 AI 视频生产路径。

一、为什么 Codex + 剪映是当下内容创作者的新刚需

2026 年，AI 视频生成已经从"能看"进化到"能批量生产"。但对大多数中文自媒体创作者来说，真正落地的痛点不是"AI 能不能剪视频"，而是"AI 能不能把我熟悉的剪映工作流接管下来"。

过去一年，行业内出现了两条主流路径：一是 Remotion 这类以 React 代码为视频源、直接渲染成片的方案，适合数据驱动和批量模板；二是基于剪映草稿文件的 Python 自动化工具，比如 JianYingApi，通过操作 draft_meta_info.json 和 draft_content.json 两个核心文件来控制时间线。但前者学习门槛高，后者对普通用户仍偏底层。

Codex + jianying-editor 的价值在于：把 Python API 封装成 Codex 可直接调用的 Skill，让创作者用自然语言描述需求，Codex 自动生成文案、调用 TTS、准备素材，最终写入剪映草稿。它不是替代剪辑师，而是把重复劳动交给 AI，人只负责节奏、审美和最终导出。

二、jianying-editor 是什么：先厘清一个常见误解

很多人第一次接触会以为 jianying-editor 是安装在剪映里的插件，实际上它是安装给 Codex 使用的 Skill。它的工作方式是：Codex 生成文案、声音和素材，再通过内部的高级封装 API JyWrapper，把视频、口播、BGM、字幕写进剪映草稿文件，最后打开剪映继续精修和导出。

根据官方 Skill 描述，jianying-editor 主要面向以下场景：当用户让 Codex 操作剪映/CapCut 桌面端、导入视频/音频素材、把素材放入时间线、在剪映内手动剪辑或精修、添加字幕、导出视频，或要求边操作剪映边记录项目日志时使用。

它提供六类核心能力：

草稿管理：创建、覆盖、克隆和检查剪映草稿
素材导入：导入视频、图片、音频和云端素材，自动安排轨道
音视频生成：生成口播、字幕并加入背景音乐
特效添加：添加标题、转场、滤镜、动画和关键帧
画面采集：调用录屏、截图、智能变焦和 Web 动效合成工具
导出检查：导出视频或字幕，并用 draft_inspector 检查轨道和片段

值得注意的是，jianying-editor 的定位是"剪映内操作记录器"，不在剪映里发生的步骤（如火山 ASR 转写、根据时间戳生成 delete_segments.json、文件级自动粗剪）不属于它的职责范围。如果需要自动粗剪口播，应该先用火山 ASR/自动剪辑 Skill 生成通过审核的粗剪 MP4，再回到剪映导入精修。

三、安装教程：让 Codex 自动安装 jianying-editor

3.1 一段提示词搞定安装

打开 Codex，新建一个对话，把下面这段提示词完整发给它：

请使用 skill-installer 安装这个 GitHub Skill： https://github.com/luoluoluo22/jianying-editor-skill.git 安装为全局技能 jianying-editor。 安装完成后创建独立 Python 虚拟环境，安装 requirements.txt， 安装 Playwright Chromium，设置 JY_SKILL_ROOT， 并运行 api_validator.py 检查环境。 最后告诉我安装目录和检查结果。

Codex 会自动完成四件事：下载安装 Skill、处理 Python 依赖、检查剪映草稿目录、运行环境校验。执行过程中如果出现联网或终端权限提示，按需允许即可。

3.2 安装注意事项

重启 Codex：安装成功后必须重启 Codex，让新技能进入可用列表。
macOS 优先：根据 Skill 说明，jianying-editor 主要针对 macOS 上的 CapCut 桌面端，通过 Computer Use 操作 com.lemon.lvpro 应用。
中文路径问题：如果 macOS 文件选择器不容易输入中文路径或中文文件名，建议在项目工作区复制一个英文名工作副本再导入。
环境校验：api_validator.py 会检查 Playwright Chromium、JY_SKILL_ROOT 等关键依赖是否就绪，这是后续稳定运行的基础。

四、小环测试：先跑一个 10 秒草稿验证环境

重启 Codex 后，不要急着做正式项目，先发一段小环测试提示词：

请使用 jianying-editor 创建一个10秒测试草稿。 加入测试视频、背景音乐和标题"Codex + 剪映测试成功"。 保存后使用 draft_inspector 检查视频、音频和字幕轨道。

Codex 会在当前工作目录编写脚本，并将草稿保存到剪映项目目录。这里有一个容易踩坑的点：剪映不会实时刷新草稿列表，生成后可以重启剪映，或者进入一个旧草稿再退出，新草稿才会出现在列表里。

小环测试通过的意义在于：验证 Skill 安装完整、Python 环境正常、剪映草稿目录可写、draft_inspector 检查工具可用。这四项都通过后，才适合进入正式项目。

五、正式工作流：用 Codex 制作一条教程口播视频

5.1 完整任务描述

小环通过后，把任务描述得更完整：

使用 jianying-editor 制作一条教程口播视频。 生成文案和分镜，调用我的声音，使用指定BGM，准备截图和录屏。 添加字幕、转场和提示音，最后写入剪映草稿并检查轨道。

5.2 四步执行流程

完整流程分为四步，对应一条完整的内容生产线：

第一步：Codex 生成口播结构。Codex 根据你的主题生成文案和分镜脚本，包括每段口播的文字、时长估算、对应的画面建议。

第二步：TTS 生成声音。调用你指定的人声（可以是音色克隆或热门音色），把文案转成口播音频。剪映本身也提供文本朗读功能，支持选择热门音色或音色克隆，但通过 Codex 调用外部 TTS 可以获得更灵活的控制。

第三步：FFmpeg 和 Computer Use 准备画面。这一步用 FFmpeg 处理视频素材（裁切、拼接、变速），用 Computer Use 自动截图和录屏。如果需要更复杂的视觉特效，可以结合 HyperFrames 这类基于 HTML/CSS/GSAP 的工具生成动态标题。

第四步：写入剪映时间线。把视频、配音、BGM、字幕和音效通过 JyWrapper 写入剪映草稿，并用 draft_inspector 检查轨道和片段是否完整。

5.3 人工精修与导出

这套方案的产物是一个可以继续编辑的剪映时间线草稿，视频、口播、BGM 和字幕都可以继续人工调整。不同剪映版本对自动导出的兼容性不同，生成草稿后人工检查导出更加稳妥。

六、横向对比：Codex + 剪映 vs Remotion vs HyperFrames vs 其他工具

6.1 三大代码驱动方案的根本差异

方案	创作源	输出	适用场景
Codex + 剪映	Python / JyProject	可编辑剪映草稿	口播、教程、自媒体
Remotion	React	代码直接渲染视频	批量模板、数据视频、逐帧控制
HyperFrames	HTML / CSS / GSAP	网页动效渲染视频	动态标题、视觉包装

Codex + 剪映的产物是可编辑的剪映草稿，适合口播、教程和自媒体内容；Remotion 以 React 代码作为视频源，适合数据驱动、批量模板和逐帧控制，最终直接渲染视频；HyperFrames 以 HTML、CSS 和 GSAP 作为视频源，更擅长网页风动画、动态标题和视觉包装。

选择逻辑很简单：如果你希望保留熟悉的剪映时间线，选择 Codex + 剪映；需要程序化批量视频，选择 Remotion；需要网页动效型视觉，选择 HyperFrames。

6.2 与 Python 剪映自动化工具的定位差异

JianYingApi 是一个更底层的第三方剪映 API，通过操作 draft_meta_info.json（项目基本信息）和 draft_content.json（时间线操作）两个文件来控制剪映。它适合开发者直接写 Python 脚本做批量处理，比如自媒体达人批量加水印、教育机构标准化课程视频、电商团队批量产品展示视频。

相比之下，jianying-editor 是在 JianYingApi 这类底层能力之上封装的 Skill，它的价值是让 Codex 用自然语言理解你的需求，自动编排底层 API 调用，而不是让你手写每一行 Python 代码。两者是互补关系：JianYingApi 适合固定流程的批量化生产，jianying-editor 适合需求多变的创意型项目。

6.3 与 VectCut、Coze 工作流的差异

站酷整理的 100 个 Codex 神级 Skill 中提到的 VectCut 剪映自动化，通过本地 HTTP 服务用自然语言指令创建剪映/CapCut 草稿，支持添加视频、音频、图片素材、SRT 字幕、文字样式、特效转场等，适合批量短视频制作和内容号批量生产。它的定位与 jianying-editor 类似，但实现路径不同——VectCut 走本地 HTTP 服务，jianying-editor 走 Codex Skill + Python API。

Coze + 剪映的工作流则更偏向无代码编排，通过可视化节点把文案撰写、素材搜寻、配音对轨、剪辑合成全流程压缩到几分钟，适合不想写代码的创作者。

七、进阶建议：把这条工作流变成可复用的内容生产线

真正值得期待的不是"AI 帮我点几下按钮"，而是把文案、声音、素材、字幕和剪映草稿连成一条可以反复使用的内容生产线。基于这套工作流，可以进一步拓展：

建立模板库：根据不同视频类型（口播、教程、Vlog、电商）创建剪映草稿模板，Codex 调用时直接复用结构，只替换内容。
接入云端素材：把阿里云 OSS 或腾讯云 COS 中的素材直接导入剪辑流程，避免本地文件管理混乱。
AI 辅助字幕：集成百度 AI 语音识别或火山 ASR 生成字幕，再由 jianying-editor 写入草稿。
自动发布闭环：对接抖音/快手开放平台，实现剪辑完成后自动发布。
日志与审计：利用 jianying-editor 的项目日志功能，每完成一个关键动作就更新日志，方便复盘和团队协作。

八、结语：AI 视频生产的下一个阶段

2026 年的 AI 视频工具已经足够多，但真正能落地的不是"全能替代"，而是"精准分工"。Codex + jianying-editor 的思路很清晰：让 AI 接管重复的内容生产环节，让人专注创意判断和最终导出。

对于口播、教程、自媒体这类高频内容，这条工作流可以把单条视频的制作时间从小时级压缩到分钟级；对于需要复杂视觉的数据视频或批量模板，Remotion 是更好的选择；对于网页动效型视觉包装，HyperFrames 更擅长。

下一阶段值得关注的，是 Codex + Remotion 搭建组件化视频工作流，以及更多垂直领域 Skill 的出现。AI 视频生产正在从"工具时代"进入"工作流时代"，谁能把文案、声音、素材、字幕和剪辑连成可复用的生产线，谁就能在内容红海中跑出来。

文章来源：本文基于《教程版：直接让 Codex 安装 jianying-editor，搭一条剪映自动化工作流》原文改写，并补充 jianying-editor 官方 Skill 文档、JianYingApi 技术文档、站酷 Codex Skill 合集、Coze 剪映工作流案例等相关资料整合而成。首发于大国AI导航（daguoai.com），转载请注明出处。

本文链接：https://www.chatgpt-codex.com/Ai/72.html

Codex 剪映自动化剪辑