AI Blog
← 返回首页
AI tools · image generation · practice

GPT Image 2 完全指南:有图有真相,真要成为过去式了

过去我们说"有图有真相",但从 GPT Image 2 上线那一刻起,这句话可能要改写了。

你能想象吗?马斯克在特斯拉展厅卖车的假截图、黄仁勋和库克的微信聊天记录、各种看起来像新闻截图的离谱内容——这些都是 GPT Image 2 做的。更夸张的是,它在 AI 生图榜单上拿到了 1512 分,比第二名高了 200 多分,OpenAI 官方都承认:从来没有一个模型能在生图评测上拉开这么大的差距。

一、GPT Image 2 到底强在哪?

先纠正一个误区——以前 AI 生图最大的痛点不是"画得丑",而是"写不了字"。海报上的汉字乱码、截图里的按钮符号鬼画符,这些都是硬伤。GPT Image 2 的突破就是:把文字渲染当成了核心竞争力来做。

具体来说,三方面质变:

1. 文字渲染——质的飞跃

不管是多行中文文本、不同字体样式,还是在复杂画面里的文字,它都能做到正确排列。海报、封面、PDF 图、信息图这些以前容易翻车的场景,现在对 GPT Image 2 来说就是"手拿把掐"。

2. 指令遵循能力大幅增强

你可以给它非常具体的需求:主体放左边、背景渐变、文字竖排、风格偏杂志质感——它基本能准确理解你的意图。这意味着它已经可以拿来当专业产品设计图的生产工具了。

3. 照片级真实感

过去的 AI 生图在人物或真实物体上经常出现过度饱和、光影不自然、材质过于光滑等问题,一眼就能看出是 AI 生成的。而 GPT Image 2 在光影、材质、人物等方面能做到接近真实商业摄影的效果。

二、8 大实测玩法

gpt-image2.mmh1.top 整理了完整的案例网站,每张图点进去都能看到完整的提示词,可以直接复制。

1. 假截图 / UI 还原

这个模型在模仿真实截图上的效果非常惊人。微信聊天界面、小红书截图、直播间、Twitter 截图——做出来的效果都足以以假乱真。提示词都是标准的结构化模板,替换掉关键字段就能精准复现。

2. 产品海报 / 品牌物料

可以在提示词里精确指定品牌名称、配色方案、人物站位、核心产品描述。出来的效果可能比一些初级设计师还好,适合做化妆品海报、产品拆解图等。

3. 信息图 / 数据可视化

文字渲染能力上来之后,包含大量文字的信息图变得非常稳定。手绘风格信息图、多步骤教程图、时间进度图都能稳定生成。特别是图文混合的高密度多模块图,每个区块的内容都能清晰呈现。

4. 学术论文配图

GPT Image 2 应该用了很多专业论文配图训练,出来的效果跟顶刊论文里的配图是一个水准,适合科研场景下的插图生成。

5. 角色设计 / 漫画分镜

多格漫画分镜、角色关系图——以前这些都要找画师干的活,现在直接出结果。特别是漫画长图做得非常好,只需要设计一个简单的功能流,就可以把一本小说转成漫画效果。

6. 架构图 / 流程图

架构图、流程图、时序图、状态图、思维导图、网络拓扑图……选择需要的风格,使用对应模板创建即可。

7. 风格化头像 / 数字人效果

生成有风格感的头像和数字人效果图。

8. 地图 / 游戏资源

生成地图、无版权游戏素材等。完整几百个案例直接在网站上找就可以了。

三、开源生图 Skill

大多数人的痛点不是"不会用",而是"用不好"。一次性对话和结构化模板之间的差距,在生图这件事上特别明显。

ConardLi 做了一件事:把实测经验沉淀成一个可以直接交给 Agent 的 Skill。

Skill 是什么?

简单说,它是一套给 AI 智能体看的工作手册。放到 Claude Code、Cursor、CodeX 这些环境里,Agent 就会按照固定流程工作:

  1. 判断环境:本地有没有生图依赖?有没有 API 可用?
  2. 分析需求:要做海报还是论文配图?
  3. 匹配模板:找到对应方向的结构化模板
  4. 补齐信息:根据模板要求提示用户补充细节
  5. 产出提示词:生成高质量的结构化提示词,直接出图

三种运行模式

上手操作

  1. 克隆仓库 → 复制 Skill 到指定目录
  2. 创建测试目录 → 启动 Claude Code
  3. 跟 Agent 说"帮我生成一张论文配图"
  4. 它会自动识别模式、找到模板、询问需求
  5. 完成,图片或提示词文件直接存到你指定的目录

项目已开源:github.com/ConardLi/garden-skills

四、一个现实问题:国内用户怎么用?

这是当前 GPT Image 2 要面对的现实:

理性来说建议"精打细算型"使用——明确知道自己要什么类型的图,规划好每一次出图,而不是随意尝试。

五、总结

GPT Image 2 最值得借鉴的不是某个具体的 prompt,而是这两件事:

  1. 案例网站——把不可复现的一次性尝试变成可复用的模板库
  2. 开源 Skill——把手工操作流程变成 Agent 的自动化能力

两者结合,真正降低了"从会用到用好"的门槛。

如果你对 AI 生图感兴趣,或者正在找 ChatGPT 强大生图能力的系统教程,这个配套资源值得动手试试。