nano-banana-2

使用 RunComfy 上的 Google Nano Banana 2（Gemini 系列闪级文生图模型）生成图像——该技能内置了模型文档中的提示模式，因此输出比直接使用同一模型进行简单提示更清晰。文档介绍了 Nano Banana 2 的优势（快速迭代、图像内文字渲染、可预测构图、可选的网络上下文）、分辨率层级定价、安全容忍度调节，以及何时改用 Nano Banana Pro / GPT Image 2 / Flux 2 / Seedream。通过本地 RunComfy CLI 调用 `runcomfy run google/nano-banana-2/text-to-image`。触发词包括“nano banana”、“nano-banana-2”、“nano banana 2”、“google image gen”、“gemini image”或任何明确要求使用此模型生成图像的请求。

2Star

1Fork

更新于 2026/6/18

获取 Skill 源代码

Nano Banana 2 — RunComfy 专业包

runcomfy.com · 模型页面 · GitHub

Google Nano Banana 2 — Gemini 系列中的闪级文生图模型，托管在 RunComfy 模型 API 上。针对创意构思、社交缩略图批量生成和快速草稿进行了优化，并具备强大的图像内文字渲染能力。

npx skills add agentspace-so/runcomfy-skills --skill nano-banana-2 -g

何时选择此模型（与同类模型对比）

Nano Banana 2 是 Google 图像生成系列的闪级模型。当迭代速度和可预测构图比最大细节更重要时，选择它。

需求	使用
快速草稿、社交缩略图、批量变体	Nano Banana 2
图像内文字渲染且可预测	Nano Banana 2
基于网络的图像（时事/真实实体）	Nano Banana 2 + `enable_web_search`
图像编辑（保留主体，替换背景）	Nano Banana Edit（同类技能）
重度风格化、绘画感	Flux 2
最大提示遵循度 + 多语言文字	GPT Image 2
2K–4K 主视觉、最大真实感	Seedream 5
超写实肖像	Nano Banana Pro

如果用户明确提到“Nano Banana”/“nano-banana-2”/“Gemini image”，则直接路由至此。如果用户说“Nano Banana”但未指定 2 还是 Pro，则肖像默认使用 Pro，其他情况默认使用 2。

前提条件

RunComfy CLI — npm i -g @runcomfy/cli
RunComfy 账户 — runcomfy login 会打开浏览器设备码流程。
CI / 容器 — 设置 RUNCOMFY_TOKEN=<token> 替代 runcomfy login。

端点 + 输入模式

`google/nano-banana-2/text-to-image`

字段	类型	必填	默认值	说明
`prompt`	字符串	是	—	主体优先的描述。
`num_images`	整数	否	1	1–4。创意构思轮次使用 4。
`seed`	整数	否	0	重复使用以实现可复现性。
`aspect_ratio`	枚举	否	`auto`	`auto`, `21:9`, `16:9`, `3:2`, `4:3`, `5:4`, `1:1`, `4:5`, `3:4`, `2:3`, `9:16`。
`resolution`	枚举	否	`1K`	`0.5K`（草稿）, `1K`（默认）, `2K`（最终）, `4K`（最大）。
`output_format`	枚举	否	`png`	`png`, `jpeg`, `webp`。
`safety_tolerance`	整数	否	4	1（严格）– 6（宽松）。
`limit_generations`	布尔	否	true	限制每次提示轮次只生成一次。
`enable_web_search`	布尔	否	false	添加网络基础（额外成本 + 延迟）。

对于图像编辑（保留主体并应用更改），请参阅同类技能 nano-banana-edit。

如何调用

默认草稿（1K，方形，png）：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{"prompt": "<用户提示>"}' \
  --output-dir <绝对路径>

垂直四联批处理用于创意构思：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "<用户提示>",
    "num_images": 4,
    "aspect_ratio": "9:16",
    "resolution": "0.5K"
  }' \
  --output-dir <绝对路径>

最终 2K 并锁定种子：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "<用户提示>",
    "resolution": "2K",
    "aspect_ratio": "16:9",
    "seed": 42
  }' \
  --output-dir <绝对路径>

基于网络（时事/真实实体）：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "<引用本周真实事件的提示>",
    "enable_web_search": true
  }' \
  --output-dir <绝对路径>

提示技巧——实际有效的方法

主体优先的陈述性语法。 "一个美国女性的电影级特写肖像，站在雨中的东京霓虹灯下，浅景深，反射的湿漉漉街道，超详细，逼真的皮肤纹理"——主要主体，然后是动作、环境、风格、镜头。前置主体；尾部加指令。

图像内文字的精确引用。 "标签上写着 'AURA'，干净粗体无衬线，居中，白底黑字"——引用实际字符。指定位置和字体样式。不要只说"带有品牌名称"然后指望它。

一致的种子用于优化。 在针对单个提示进行小变体迭代时锁定 seed——保持构图稳定。

谨慎使用网络基础。 仅当提示涉及时事/真实实体时才启用 enable_web_search。会增加延迟和成本；默认关闭。

不要冲突风格。 "极简 + 华丽 + 复古 + 赛博朋克"会相互抵消。选择 1–2 个锚点。

反模式：

试图用语言描述稳定的主体身份——改用带有图像引用的编辑端点。
请求超出 4 个层级的分辨率 → 422。
超出 11 个支持值的长宽比 → 422。
未引用的图像内文字 → 不可预测的渲染。

优势场景

用例	为什么选择 Nano Banana 2
营销草稿缩略图（四联批）	0.5K 快速迭代，然后提升胜出者至 2K
社交平台原生	支持宽幅长宽比，包括 9:16、4:5、21:9
海报/卡片中的图像内文字	引用字符时文字渲染可预测
基于网络的时事图像	`enable_web_search` 集成最新信息
可复现的变体测试	强种子 + 一致构图

示例提示（已验证可产生强结果）

电影级肖像（页面示例）：

一个美国女性的电影级特写肖像，站在雨中的东京霓虹灯下，浅景深，反射的湿漉漉街道，超详细，逼真的皮肤纹理

带引用文字的品牌资产卡片：

一个极简的 16:9 产品卡片：一个哑光黑色陶瓷杯居中放在柔软的暖灰色纸背景上，左上角边缘高光，标题 "Brewed Quietly" 以干净粗体无衬线字体位于右上角，下方平衡留白，电商就绪，干净的影棚灯光

垂直平台原生：

一个 9:16 垂直主视觉用于健康品牌：一个陶瓷茶杯放在亚麻桌布上，柔和的早晨侧光，顶部大字手绘衬线字体 "Slow Down"，轻柔蒸汽上升，中性色调，简洁

限制

仅静态图像。 此端点不支持视频。
每次请求最多 4 个输出。
网络搜索增加延迟和成本 — 仅按需启用。
2K / 4K 成本更高 — 除非用户要求更高，否则默认 1K。
对于图像编辑，请使用 /edit 端点 — 不是此端点。

退出码

码	含义
0	成功
64	CLI 参数错误
65	输入 JSON 错误 / 模式不匹配
69	上游 5xx
75	可重试：超时 / 429
77	未登录或令牌被拒绝

完整参考：docs.runcomfy.com/cli/troubleshooting。

工作原理

该技能使用与模式匹配的 JSON 主体调用 runcomfy run google/nano-banana-2/text-to-image。CLI 向 https://model-api.runcomfy.net/v1/models/google/nano-banana-2/text-to-image 发送 POST 请求，轮询请求，获取结果，并将任何 .runcomfy.net/.runcomfy.com URL 下载到 --output-dir。Ctrl-C 在退出前取消远程请求。

安全与隐私

令牌存储：runcomfy login 将 API 令牌写入 ~/.config/runcomfy/token.json，权限为 0600（仅所有者读写）。在 CI/容器中设置 RUNCOMFY_TOKEN 环境变量以完全绕过文件。
输入边界：用户提示通过 --input 作为 JSON 字符串传递给 CLI。CLI 不会对提示进行 shell 扩展；它直接通过 HTTPS 将 JSON 主体传输到模型 API。提示内容无 shell 注入风险。
第三方内容：您传递的图像/蒙版/视频 URL 由 RunComfy 模型服务器获取，而非您机器上的 CLI。将外部 URL 视为不可信；基于图像的提示注入是任何图像编辑/视频编辑模型的已知风险。
出站端点：仅 model-api.runcomfy.net（请求提交）和 *.runcomfy.net / *.runcomfy.com（生成输出的下载白名单）。无遥测，无回调。
生成文件大小上限：CLI 会中止任何超过 2 GiB 的单个下载，以防止恶意或失控模型输出导致磁盘填满。

你可能还喜欢

blucli

385Kresearch-knowledge

BluOS CLI (blu) for discovery, playback, grouping, and volume.

steipete

获取

agent-architecture-audit

237Kresearch-knowledge

Full-stack diagnostic for agent and LLM applications. Audits the 12-layer agent stack for wrapper regression, memory pollution, tool discipline failures, hidden repair loops, and rendering corruption. Produces severity-ranked findings with code-first fixes. Essential for developers building agent applications, autonomous loops, or any LLM-powered feature.

affaan-m

获取

triaging-issues

102Kresearch-knowledge

Triages GitHub issues by routing to oncall teams, applying labels, and closing questions. Use when processing new PyTorch issues or when asked to triage an issue.

pytorch

获取

继续探索

浏览 research-knowledge 热门 Skills 最近更新