GPT Generate blog cover

GPT Generate blog cover
GPT Generate blog cover

我希望快速获得一个优秀的 blog 封面,我最开始想着是自己写 prompt,然后 ChatGPT 帮我生成。

根据 prompt 生成图片

思路是:

  1. 询问 ChatGPT 我应该做什么,比如关于 blog 的图片应该是什么风格的?然后我应该选择一个我喜欢的风格。
  2. 选择好风格之后,根据这个风格生成图片的 prompt
  3. 创建 GPTs
  4. 测试 GPTs

不可行—需要自己想出应该画什么

根据 blog 内容去总结标题,然后根据标题生成相关的图片的 prompt,这很难短时间得到想要的图片。这就像画画,你自己首先得知道你要画什么,比如场景、人物、色调等等。但是我根本就不知道我需要什么样子的画,我只是想快速能给我 blog 得到一个图片。

然后我试着简化 prompt,但是这样的话,每个 blog 的图片几乎都一样,只是里面的标题单词不一样而已。

放弃!

接下来,应该先养成一个好的 Taste

先找到好的封面设计图,然后找到最好的封面设计图,然后喂给 AI,让 AI 模仿这些最优秀的图,去生成我想要的。但是这好像还是很复杂,我可能需要让 AI 解析这个图片,然后让 AI 重新生成,这好像还是不符合我想要快速得到一个 blog 封面的需求。

我觉得我应该去一些图片网站,去选一些好看的图片,然后让 AI 帮我裁剪或者拓展或者微调等,这样来得到一个 blog 封面。

以下是一些图片网站:

www.behance.net

dribbble.com

www.pinterest.com

其中最好用是 pinterest!这个网站里面的图片都很有质感!

GPTs

我应该使用 AI 来对图片进行裁剪等微调,而不是让 AI 来生成图片。这个 GPT 做的就是把图片进行裁剪,或者填充,让他成为 blog 封面的大小的格式。

GPTs-Help-blog-cover-image-generate

GPTs actions

我看到 GPTs 有 actions,看起来可以调用外部的接口,我想用这个来直接从 pinterest 拉取我的账号主页中的 feeds

我希望我的 GPTs 能够自动推荐一些图片。看看是否可以做到。

尝试 pinterest scrape library 拉取图片

尝试了几个项目,最终 pinterest-dl 这个项目看起来不错,支持登录,并且支持配置拉取指定网页地址的图片。

pinterest_feed这是我的项目地址,使用 Django 支持 http 调用的方式获得自己账号下的主页图片。

兴冲冲的尝试GPTs actions

项目部署成功后,https 和域名都配置好后,兴冲冲的尝试写 actions,发现 GPTs 可以根据图片 url 来渲染出来,显示到 chat 中,但是我在尝试下一步,将图片进行 resize,变成 blog cover 时,ChatGPT 却不知道哪里搞了一个图片,随便生成了一个。我尝试了几次都是一样的结果,而且每次的失败原因都不一样。我觉得 GPTs 的任务编排的能力很差劲,或者说他没有提供任务编排能力的入口,导致任务不能按照预期去执行。OpenAI 的想法是我们描述每一个 actions,让 LLM 去判断应该执行什么,但看起来他的上下文衔接并不好。或者他的 MCP tool 能力有限?

结论

GPTs 的流程并不容易控制,还是 Langchain 这种专业的能够完成我的想法。GPTs 只适合一些流程简单的动作,比如你上传图片做 resize,他的 actions 等等,看起来并不好用,他的衔接完全是通过 LLM 来做的,出参入参都没法控制。

如果有需要将某些图片进行 resize,然后作为 blog 封面,可以尝试用我的 GPTs:GPTs-Help-blog-cover-image-generate

如果你想拉取自己 pinterest 的账号的首页 feeds 流,可以尝试我的项目:pinterest_feed

接下来还会有一个无 Django 背景下的,几乎纯 AI 开发的视频讲解。就是上面我的pinterest_feed项目的开发过程,我打算录制一期视频,和大家交流下 cursor 的使用实践。

Read more

为什么 Harness 最近突然火了?

为什么 Harness 最近突然火了?

它到底是什么 Harness Engineering 不是多写几句 prompt,也不只是给 AI 配几个工具。它本质上是在设计一整套让 AI 稳定工作的开发流程:给它上下文,接上工具,写清规则,保留状态,观察执行,出错后还能继续恢复。模型只是大脑,Harness 才是让这个大脑真正进入项目、持续干活的工作台、护栏和反馈闭环。没有这套东西,模型再强,也很容易停留在“一次回答很好看,但一进真实流程就不稳定”。 你为什么现在就得学 因为开发已经开始从“人写代码,AI偶尔帮一下”,走向“人搭系统,AI持续参与执行”。如果你还停留在旧思路里,把 AI 当聊天框、问答器、代码补全器,那套方法很快就会落后。接下来真正拉开差距的,不是谁更会问问题,而是谁先学会把 AI 接进文档、代码、测试、日志和协作流程里,让它稳定复现、

By Keboom007

我的第一个产品上线了!这是程序员的成人礼

Get Out VideoLanding page for Get Out Video 说实话,我到现在还有点小激动。 上面的链接是我的第一个产品,一个帮你从 YouTube 提取字幕、快速分析视频内容的工具。从写第一行代码到真正部署上线让用户能访问,我终于完成了程序员生涯中的第一个「成人礼」。 这个工具是做什么的? 相信很多人都有过这种经历:刷到一条看起来很有料的 YouTube 视频,标题很吸引人,但一点开——好家伙,一个半小时。 这时候你就陷入了两难: * 直接划走吧,万一真的很有价值呢? * 硬着头皮看吧,时间成本太高了,而且很多时候看完发现干货没多少,后悔得不行 * 想快进预览一下吧,视频这玩意又不能像文字那样扫一眼就知道讲什么 我的产品就是想解决这个问题。 你把 YouTube 链接丢给它,它能帮你 1. 快速提取视频的字幕内容(不管有没有官方字幕都能搞定) 2. 自动总结核心观点,让你几秒钟就知道这个视频值不值得花时间看 3. 对于那些知识密度一般的视频,直接看总结就行了,

By Keboom007
AI 短剧实测:体验过后,我发现了“产品经理”和“真导演”的区别

AI 短剧实测:体验过后,我发现了“产品经理”和“真导演”的区别

前两天刷到一个 AI 做的短剧《嫡女泣血,母亲掀翻帝王家》,当时我就震惊了。虽然口型还有点对不上,但那个人物精致度,那个氛围感,真的让我这个技术宅有点坐不住了。 于是我心血来潮,决定自己动手试一试。结果这一试不要紧,直接把我的钱包试空了,还顺带把市面上的 AI 视频工具踩了个遍。 今天就来跟大家聊聊,想做一部 AI 动态漫,到底要经历多少“九九八十一难”。 一、 工具吐槽大会:谁是真导演,谁是 PPT 经理? 在 AI 视频生成这个圈子里,工具主要分三派:硬核极客派、偷懒神器派,还有氪金大佬派。 1. ComfyUI:硬核极客的“可视化编程” ComfyUI 就像是给了你一堆乐高积木,你想搭什么都行,前提是你得懂怎么搭。 * 优点:极其灵活,什么 Stable Diffusion、AnimateDiff、

By Keboom007
PLG 是什么?

PLG 是什么?

什么是 PLG? 最近听说好多次 PLG,一看到英文缩写,便不觉厉。看起来很高大上,有没有? 那么它实际的含义是:Product Led Growth(产品驱动增长) 又是一句听起来像废话的概念,把产品做好,不是企业的本分么? 那到底啥是 PLG? 不用销售追着客户跑,不用搞那一套复杂的 PPT 演示。直接把产品扔给用户,好不好用,试一下就知道。如果产品够硬,用户不仅自己掏钱,还会忍不住安利给身边的朋友:“哎,这个东西太好用了,你快试试!” 这就是“产品驱动增长”——让产品本身成为最大的销售员。 这就跟咱们平时用的好东西一样: * 别废话,直接用:想用就注册,别让我填一堆表单还要等销售打电话。 * 先尝后买:好不好用先免费试试,觉得爽了自然会付费,不强买强卖。 * 上手即爽:别让我看半天说明书,上手几分钟就得让我觉得“卧槽,这功能太牛了”。 * 自来水:好东西大家都会口口相传,

By Keboom007