Keboom

短剧生产已经工业化，真正难的是懂市场

我最近看了一圈 AI 视频课程，发现短剧生产流程已经越来越清楚：剧本、分镜、人物图、场景图、图生视频、配音、配乐、剪辑、超分。这说明技术和流水线已经逐渐不是核心问题。更前置的问题是：市场要什么样的短剧，什么题材正在跑出来，以及我们怎么把短剧投放到市场里。生产流程已经很清楚了我最近看了 B 站上一些关于 AI 视频的课程，主要是想搞清楚现在别人做 AI 短剧，大概是怎么走完整流程的。看下来之后，我的第一感受是：流程其实已经比较清楚了。它不是一个单点 prompt 的问题，而是一整套生产链路。先有一个剧本，或者说一个故事。然后把故事拆成分镜，再生成角色、场景、首帧、尾帧，接着用图生视频模型生成镜头，最后处理配音、配乐、剪辑、字幕和画质提升。具体到工具层面，有些工具更偏图像生成和局部控制，有些模型更偏视频生成。

如何用好 AI Image？

如何才能生成我想要的图？我要去学什么？学 prompt 技巧？不不，看看那些文学家如何描绘风景画的吧。 AI 生成图片已经很像 AI 编程我看完 OpenAI 最新的图像生成 prompting guide 之后，最大的感受不是“模型又变强了”，而是 AI 画图正在变得像 AI 编程。如果一张图没有生成出来，很多时候不是 AI 完全做不到，而是你没有把需求说清楚。你没有讲清楚背景、主体、细节、约束，也没有告诉它什么必须保持不变。这跟现在用 AI 写代码很像。AI 已经能完成大部分代码，但你要让它真正写对，就必须讲清楚需求、接口、边界、不变量和测试反馈。图像生成也是同一个逻辑。所以图像生成的关键，是你能不能按照 openai 的规则，描述出你脑子中想要的图。

当 AI 足够会执行之后，真正的问题变了

今天我做了一个浏览器插件。但我觉得插件本身不是重点。重要的是，这个过程让我感觉到：AI 现在已经不只是帮你写代码，而是能直接把结果做出来的执行者。重点不是插件我对于浏览器插件开发几乎一无所知。以前如果我要做这种东西，大概率要先查 Manifest 是什么，插件怎么安装，脚本怎么拆，权限怎么写。但这次我只是把一个脚本丢给 AI，说：我想把它改成浏览器插件的形式。AI 自动帮我改好了，并且告诉我怎么安装。整个过程很顺，一次成功，装上之后基本就是可以用的状态。后面的交互修改也很直接。我截图给 AI，说这个地方怎么改，按钮怎么调整。它几乎都能一遍过地改出来。人越来越只需要对结果负责如果说以前我们需要改一些前端代码，那么至少要懂一点前端基础。或者说，至少要能监督 AI，判断它改得对不对。现在的话，我越来越觉得，人可以把注意力从过程里抽出来，只盯最终结果。我不用关心它怎么拆文件，不用关心代码规范，也不用关心中间用了什么实现方式。我只需要看这个插件最终是不是我想要的：按钮对不对，交互顺不顺，功能有没有到位。

电脑完全托管给 Codex 后，触发了 OpenAI 的 Cyber 风控

昨天用 Codex 的时候，我触发了 OpenAI 的 cyber 风控。大概就是 Codex 做着做着，突然提示说这个内容可能有 cybersecurity risk，然后任务就被中断了。上面这张图就是当时 Codex 里的提示。可以看到它正在用 Chrome DevTools，动作是 Evaluate script，然后提示这段内容可能有 cybersecurity risk，还让我如果是在做授权的安全工作，可以去 chatgpt.com/cyber。点过去之后就是这个 Trusted Access for Cyber 的页面。它大概就是让你做身份验证，验证通过之后，才更适合继续做这类可能被判断为 cyber 的工作。我不是让它只帮我写一段代码，而是直接把电脑操作权限交给了它。让它看我当前打开的广告后台，操控 Chrome，查看 DevTools，

Codex Chronicle

OpenAI 最近给 Codex 上了一个新功能，叫 Chronicle。虽然它目前还是 research preview，主要面向 Pro 用户开放，但我觉得这个功能的出发点非常好。它是干嘛的？简单说，就是 Codex 可以读取你最近的屏幕上下文，然后把这些上下文作为一种记忆存起来。这样一来，我们就不用再反复描述很多烦人的东西了。以前让 AI 干活，经常要先说一大堆背景：我刚才在干嘛，我现在的工作是什么，我刚才看到了什么，工作场景是什么，我做了哪些操作，然后再把这些东西讲清楚，最后才让 AI 开始干活。这一步其实很浪费时间。 Chronicle 想解决的就是这个问题。它把你屏幕上的上下文变成 AI 可以理解的记忆，让你可以直接接着当前工作往下说。这个体验其实更像人和人之间的协作。比如我们两个人都看到了同一个东西，那我就不用再把这个东西从头到尾描述一遍。我可以直接说：这个地方怎么处理？这个问题怎么定方案？因为我们共享了同一个现场。 AI 以前的问题是，