nano-banana-2

使用 RunComfy 上的 Google Nano Banana 2（Gemini 系列闪级文生图模型）生成图像——技能内置了该模型经过验证的提示模式，相比直接使用同一模型进行简单提示，可获得更精准的输出。文档介绍了 Nano Banana 2 的优势（快速迭代、图像内文字渲染、可预测构图、可选的网络上下文）、分辨率等级定价、安全容忍度调节，以及何时改用 Nano Banana Pro / GPT Image 2 / Flux 2 / Seedream。通过本地 RunComfy CLI 调用 `runcomfy run google/nano-banana-2/text-to-image`。触发词包括“nano banana”、“nano-banana-2”、“nano banana 2”、“google image gen”、“gemini image”或任何明确要求使用此模型生成图像的请求。

2Star

2Fork

更新于 2026/6/18

获取 Skill 源代码

Nano Banana 2 — RunComfy 专业包

runcomfy.com · 模型页面 · GitHub

Google Nano Banana 2 — Gemini 系列中的闪级文生图模型，托管在 RunComfy 模型 API 上。针对创意构思、社交媒体缩略图批量生成和快速草稿进行了优化，并具备强大的图像内文字渲染能力。

npx skills add agentspace-so/runcomfy-skills --skill nano-banana-2 -g

何时选择此模型（对比同类模型）

Nano Banana 2 是 Google 图像生成系列的闪级模型。当迭代速度和可预测构图比最大细节更重要时，选择它。

需求	使用
快速草稿、社交媒体缩略图、批量变体	Nano Banana 2
图像内文字渲染，结果可预测	Nano Banana 2
基于网络的图像（时事/真实实体）	Nano Banana 2 + `enable_web_search`
图像编辑（保留主体，替换背景）	Nano Banana Edit（配套技能）
重度风格化、绘画感	Flux 2
最大提示遵循度 + 多语言文字	GPT Image 2
2K–4K 主视觉图、最大真实感	Seedream 5
超写实肖像	Nano Banana Pro

如果用户明确提到“Nano Banana”/“nano-banana-2”/“Gemini image”，则直接路由至此。如果用户说“Nano Banana”但未指定 2 还是 Pro，则肖像默认使用 Pro，其他情况默认使用 2。

前提条件

RunComfy CLI — npm i -g @runcomfy/cli
RunComfy 账户 — runcomfy login 会打开浏览器设备码流程。
CI/容器 — 设置 RUNCOMFY_TOKEN=<token> 代替 runcomfy login。

端点 + 输入模式

`google/nano-banana-2/text-to-image`

字段	类型	必填	默认值	说明
`prompt`	string	是	—	主体优先的描述。
`num_images`	int	否	1	1–4。创意构思轮次使用 4。
`seed`	int	否	0	重复使用以实现可复现性。
`aspect_ratio`	enum	否	`auto`	`auto`, `21:9`, `16:9`, `3:2`, `4:3`, `5:4`, `1:1`, `4:5`, `3:4`, `2:3`, `9:16`。
`resolution`	enum	否	`1K`	`0.5K`（草稿）、`1K`（默认）、`2K`（最终）、`4K`（最大）。
`output_format`	enum	否	`png`	`png`, `jpeg`, `webp`。
`safety_tolerance`	int	否	4	1（严格）– 6（宽松）。
`limit_generations`	bool	否	true	限制每次提示轮次只生成一次。
`enable_web_search`	bool	否	false	添加网络上下文（额外费用和延迟）。

对于图像编辑（保留主体并应用更改），请参阅配套技能 nano-banana-edit。

如何调用

默认草稿（1K，方形，png）：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{"prompt": "<用户提示>"}' \
  --output-dir <绝对路径>

垂直四联批处理用于创意构思：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "<用户提示>",
    "num_images": 4,
    "aspect_ratio": "9:16",
    "resolution": "0.5K"
  }' \
  --output-dir <绝对路径>

最终 2K 并锁定种子：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "<用户提示>",
    "resolution": "2K",
    "aspect_ratio": "16:9",
    "seed": 42
  }' \
  --output-dir <绝对路径>

基于网络（时事/真实实体）：

runcomfy run google/nano-banana-2/text-to-image \
  --input '{
    "prompt": "<引用本周真实事件的提示>",
    "enable_web_search": true
  }' \
  --output-dir <绝对路径>

提示技巧——实际有效的方法

主体优先的陈述式语法。 "A cinematic close-up portrait of an American woman standing under neon lights in rainy Tokyo, shallow depth of field, reflective wet streets, ultra-detailed, realistic skin texture" — 主要主体，然后是动作、环境、风格、镜头。主体前置；指令后置。

图像内文字的精确引用。 "The label reads 'AURA' in clean bold sans-serif, centered, white on black" — 引用实际字符。指定位置和字体样式。不要只说"带有品牌名称"然后期望结果。

一致的种子用于优化。 在针对同一提示进行小幅变体迭代时锁定 seed — 保持构图稳定。

谨慎使用网络上下文。 仅当提示涉及时事/真实实体时才启用 enable_web_search。会增加延迟和成本；默认关闭。

不要混合冲突的风格。 "minimalist + ornate + retro + cyberpunk" 会相互抵消。选择 1–2 个锚点。

反模式：

试图用语言描述稳定的主体身份 — 应使用带有图像引用的编辑端点。
请求超出 4 个等级的分辨率 → 422。
超出 11 个支持值的宽高比 → 422。
图像内文字未加引号 → 渲染结果不可预测。

优势场景

用例	为什么选择 Nano Banana 2
营销草稿缩略图（批量 4 张）	0.5K 快速迭代，然后提升胜出者至 2K
社交媒体原生	支持多种宽高比，包括 9:16、4:5、21:9
海报/卡片中的图像内文字	引用字符时文字渲染可预测
基于网络的时事图像	`enable_web_search` 整合最新信息
可复现的变体测试	强大的种子和一致的构图

示例提示（已验证可产生强结果）

电影感肖像（页面示例）：

A cinematic close-up portrait of an American woman standing under neon
lights in rainy Tokyo, shallow depth of field, reflective wet streets,
ultra-detailed, realistic skin texture

带引用文字的品牌素材卡片：

A minimalist 16:9 product card: a matte black ceramic mug centered on a
soft warm-grey paper background, rim highlight from upper-left, the
headline "Brewed Quietly" in clean bold sans-serif top-right, balanced
negative space below, e-commerce ready, clean studio lighting

垂直平台原生：

A 9:16 vertical hero for a wellness brand: a single ceramic teacup on a
linen runner, soft morning side-light, the words "Slow Down" in
hand-drawn serif large at the top, gentle steam rising, neutral color
palette, uncluttered

限制

仅静态图像。 此端点不支持视频。
每次请求最多 4 个输出。
网络搜索增加延迟和成本 — 仅在需要时启用。
2K / 4K 成本更高 — 除非用户要求更高分辨率，否则默认使用 1K。
对于图像编辑，请使用 /edit 端点 — 不是此端点。

退出码

代码	含义
0	成功
64	CLI 参数错误
65	输入 JSON 错误 / 模式不匹配
69	上游 5xx 错误
75	可重试：超时 / 429
77	未登录或令牌被拒绝

完整参考：docs.runcomfy.com/cli/troubleshooting。

工作原理

该技能使用符合模式的 JSON 主体调用 runcomfy run google/nano-banana-2/text-to-image。CLI 向 https://model-api.runcomfy.net/v1/models/google/nano-banana-2/text-to-image 发送 POST 请求，轮询请求状态，获取结果，并将任何 .runcomfy.net/.runcomfy.com URL 下载到 --output-dir。Ctrl-C 在退出前取消远程请求。

安全与隐私

令牌存储：runcomfy login 将 API 令牌写入 ~/.config/runcomfy/token.json，权限模式为 0600（仅所有者读写）。在 CI/容器中设置 RUNCOMFY_TOKEN 环境变量可完全绕过文件。
输入边界：用户提示通过 --input 作为 JSON 字符串传递给 CLI。CLI 不会对提示进行 shell 扩展；它直接将 JSON 主体通过 HTTPS 传输到模型 API。提示内容不存在 shell 注入风险。
第三方内容：您传递的图像/蒙版/视频 URL 由 RunComfy 模型服务器获取，而非您机器上的 CLI。请将外部 URL 视为不可信；基于图像的提示注入是任何图像编辑/视频编辑模型的已知风险。
出站端点：仅 model-api.runcomfy.net（请求提交）和 *.runcomfy.net / *.runcomfy.com（生成输出的下载白名单）。无遥测，无回调。
生成文件大小上限：CLI 会中止任何超过 2 GiB 的单个下载，以防止恶意或失控的模型输出导致磁盘填满。

你可能还喜欢

blucli

385Kresearch-knowledge

BluOS CLI (blu) for discovery, playback, grouping, and volume.

steipete

获取

agent-architecture-audit

237Kresearch-knowledge

Full-stack diagnostic for agent and LLM applications. Audits the 12-layer agent stack for wrapper regression, memory pollution, tool discipline failures, hidden repair loops, and rendering corruption. Produces severity-ranked findings with code-first fixes. Essential for developers building agent applications, autonomous loops, or any LLM-powered feature.

affaan-m

获取

triaging-issues

102Kresearch-knowledge

Triages GitHub issues by routing to oncall teams, applying labels, and closing questions. Use when processing new PyTorch issues or when asked to triage an issue.

pytorch

获取

继续探索

浏览 research-knowledge 热门 Skills 最近更新