短剧生产已经工业化,真正难的是懂市场

我最近看了一圈 AI 视频课程,发现短剧生产流程已经越来越清楚:剧本、分镜、人物图、场景图、图生视频、配音、配乐、剪辑、超分。这说明技术和流水线已经逐渐不是核心问题。更前置的问题是:市场要什么样的短剧,什么题材正在跑出来,以及我们怎么把短剧投放到市场里。 生产流程已经很清楚了 我最近看了 B 站上一些关于 AI 视频的课程,主要是想搞清楚现在别人做 AI 短剧,大概是怎么走完整流程的。看下来之后,我的第一感受是:流程其实已经比较清楚了。 它不是一个单点 prompt 的问题,而是一整套生产链路。 先有一个剧本,或者说一个故事。然后把故事拆成分镜,再生成角色、场景、首帧、尾帧,接着用图生视频模型生成镜头,最后处理配音、配乐、剪辑、字幕和画质提升。 具体到工具层面,有些工具更偏图像生成和局部控制,有些模型更偏视频生成。

如何用好 AI Image?

如何才能生成我想要的图?我要去学什么?学 prompt 技巧? 不不,看看那些文学家如何描绘风景画的吧。 AI 生成图片已经很像 AI 编程 我看完 OpenAI 最新的图像生成 prompting guide 之后,最大的感受不是“模型又变强了”,而是 AI 画图正在变得像 AI 编程。 如果一张图没有生成出来,很多时候不是 AI 完全做不到,而是你没有把需求说清楚。你没有讲清楚背景、主体、细节、约束,也没有告诉它什么必须保持不变。 这跟现在用 AI 写代码很像。AI 已经能完成大部分代码,但你要让它真正写对,就必须讲清楚需求、接口、边界、不变量和测试反馈。图像生成也是同一个逻辑。 所以图像生成的关键,是你能不能按照 openai 的规则,描述出你脑子中想要的图。

当 AI 足够会执行之后,真正的问题变了

今天我做了一个浏览器插件。但我觉得插件本身不是重点。重要的是,这个过程让我感觉到:AI 现在已经不只是帮你写代码,而是能直接把结果做出来的执行者。 重点不是插件 我对于浏览器插件开发几乎一无所知。以前如果我要做这种东西,大概率要先查 Manifest 是什么,插件怎么安装,脚本怎么拆,权限怎么写。 但这次我只是把一个脚本丢给 AI,说:我想把它改成浏览器插件的形式。AI 自动帮我改好了,并且告诉我怎么安装。整个过程很顺,一次成功,装上之后基本就是可以用的状态。 后面的交互修改也很直接。我截图给 AI,说这个地方怎么改,按钮怎么调整。它几乎都能一遍过地改出来。 人越来越只需要对结果负责 如果说以前我们需要改一些前端代码,那么至少要懂一点前端基础。或者说,至少要能监督 AI,判断它改得对不对。 现在的话,我越来越觉得,人可以把注意力从过程里抽出来,只盯最终结果。 我不用关心它怎么拆文件,不用关心代码规范,也不用关心中间用了什么实现方式。我只需要看这个插件最终是不是我想要的:按钮对不对,交互顺不顺,功能有没有到位。

电脑完全托管给 Codex 后,触发了 OpenAI 的 Cyber 风控

昨天用 Codex 的时候,我触发了 OpenAI 的 cyber 风控。 大概就是 Codex 做着做着,突然提示说这个内容可能有 cybersecurity risk,然后任务就被中断了。 上面这张图就是当时 Codex 里的提示。可以看到它正在用 Chrome DevTools,动作是 Evaluate script,然后提示这段内容可能有 cybersecurity risk,还让我如果是在做授权的安全工作,可以去 chatgpt.com/cyber。 点过去之后就是这个 Trusted Access for Cyber 的页面。它大概就是让你做身份验证,验证通过之后,才更适合继续做这类可能被判断为 cyber 的工作。 我不是让它只帮我写一段代码,而是直接把电脑操作权限交给了它。让它看我当前打开的广告后台,操控 Chrome,查看 DevTools,

Codex Chronicle

OpenAI 最近给 Codex 上了一个新功能,叫 Chronicle。 虽然它目前还是 research preview,主要面向 Pro 用户开放,但我觉得这个功能的出发点非常好。 它是干嘛的?简单说,就是 Codex 可以读取你最近的屏幕上下文,然后把这些上下文作为一种记忆存起来。 这样一来,我们就不用再反复描述很多烦人的东西了。 以前让 AI 干活,经常要先说一大堆背景:我刚才在干嘛,我现在的工作是什么,我刚才看到了什么,工作场景是什么,我做了哪些操作,然后再把这些东西讲清楚,最后才让 AI 开始干活。 这一步其实很浪费时间。 Chronicle 想解决的就是这个问题。它把你屏幕上的上下文变成 AI 可以理解的记忆,让你可以直接接着当前工作往下说。 这个体验其实更像人和人之间的协作。 比如我们两个人都看到了同一个东西,那我就不用再把这个东西从头到尾描述一遍。我可以直接说:这个地方怎么处理?这个问题怎么定方案?因为我们共享了同一个现场。 AI 以前的问题是,