Clawdbot Skills

OpenAI Image Gen Skill - Clawdbot向けバッチ画像生成機能

Clawdbot向けOpenAI Image Gen Skillを利用して、OpenAI Images APIによるバッチ画像生成とHTMLギャラリー自動作成を実現する方法を解説します。

投稿者: AI Tools Hub 2026年2月15日

Clawdbot OpenAI DALL-E 画像生成 API Python

OpenAI Image Gen Skill - Clawdbot向けバッチ画像生成機能

ClawdbotのOpenAI Image Gen Skillは、OpenAI Images APIを使用した画像のバッチ生成機能を提供する。ランダムプロンプトサンプラーを搭載し、複数画像の一括生成とHTMLギャラリーの自動作成が可能である。DALL-E 2、DALL-E 3、およびGPT Imageモデル（gpt-image-1、gpt-image-1-mini、gpt-image-1.5）に対応している。

概要

OpenAI Image Gen Skillは、Pythonスクリプト（gen.py）を中心とした画像生成ワークフローを提供する。プロンプトのバリエーション生成、APIリクエスト、画像ダウンロード、ギャラリーHTMLの生成を自動化し、クリエイティブワークフローを効率化する。

2026年2月時点で、OpenAIは以下の画像生成モデルを提供している:

DALL-E 3: 高品質画像生成（1024x1024、1792x1024、1024x1792対応）
DALL-E 2: 従来モデル（256x256、512x512、1024x1024対応）
GPT Imageシリーズ: 最新モデル（gpt-image-1、gpt-image-1-mini、gpt-image-1.5）。透過背景、WebP出力、複数サイズ対応

技術的仕様

システム要件

Python: Python 3.7以上
環境変数: OPENAI_API_KEY（OpenAI APIキー）
依存ライブラリ: openai、requests（gen.pyで自動インストール）

インストール方法

Homebrew経由でのPythonインストール（macOS）:

brew install python

OpenAI APIキーの設定:

export OPENAI_API_KEY="sk-..."
echo 'export OPENAI_API_KEY="sk-..."' >> ~/.zshrc  # または ~/.bashrc

コマンドライン引数

gen.pyの主要オプション:

オプション	説明	デフォルト値
`--count`	生成画像数	4
`--model`	使用モデル（dall-e-2、dall-e-3、gpt-image-1等）	gpt-image-1
`--size`	画像サイズ（モデル依存）	1024x1024
`--quality`	品質（モデル依存）	high（GPT Image）/ standard（DALL-E）
`--prompt`	固定プロンプト（指定しない場合はランダム生成）	なし
`--background`	背景（transparent/opaque/auto、GPT Imageのみ）	auto
`--output-format`	出力形式（png/jpeg/webp、GPT Imageのみ）	png
`--style`	スタイル（vivid/natural、DALL-E 3のみ）	なし
`--out-dir`	出力ディレクトリ	~/Projects/tmp/openai-image-gen-*

主要機能

モデル別パラメータ対応

各モデルは異なるパラメータセットをサポートする:

GPT Imageモデル（gpt-image-1、gpt-image-1-mini、gpt-image-1.5）:

サイズ: 1024x1024、1536x1024（横長）、1024x1536（縦長）、auto
品質: auto、high、medium、low
背景: transparent（透過）、opaque（不透明）、auto
出力形式: png、jpeg、webp
バッチ生成: --countで複数画像の同時生成が可能

DALL-E 3:

サイズ: 1024x1024、1792x1024、1024x1792
品質: hd、standard
スタイル: vivid（超リアル、ドラマチック）、natural（自然な見た目）
制限: 1回のリクエストで1画像のみ（n=1）

DALL-E 2:

サイズ: 256x256、512x512、1024x1024
品質: standard
バッチ生成: 複数画像の同時生成が可能

ランダムプロンプト生成

--promptを指定しない場合、スクリプトは構造化されたランダムプロンプトを生成する。プロンプトテンプレートには以下のバリエーションが含まれる:

被写体（astronaut、lobster、dragon等）
スタイル（ultra-detailed studio photo、watercolor painting等）
ライティング（cinematic lighting、soft ambient light等）

HTMLギャラリー自動生成

生成された全画像を表示するHTMLファイル（index.html）が自動作成される。サムネイル表示、画像クリックでの拡大表示に対応。

出力ディレクトリ構成:

~/Projects/tmp/openai-image-gen-20260215-143022/
├── image-001.png
├── image-002.png
├── image-003.png
├── prompts.json
└── index.html

prompts.jsonには、各画像とプロンプトのマッピングが記録される:

{
  "image-001.png": "ultra-detailed studio photo of a lobster astronaut",
  "image-002.png": "watercolor painting of a dragon in the mountains",
  ...
}

実装例

1. GPT Imageモデルでの高品質画像生成

python3 gen.py --count 16 --model gpt-image-1 --size 1536x1024 --quality high

生成後、自動的にブラウザでギャラリーを開く:

open ~/Projects/tmp/openai-image-gen-*/index.html

2. 透過背景のロゴ画像生成

python3 gen.py \
  --model gpt-image-1.5 \
  --background transparent \
  --output-format webp \
  --prompt "minimalist tech company logo with blue gradient" \
  --count 8 \
  --out-dir ./logos

3. DALL-E 3での超高解像度画像生成

python3 gen.py \
  --model dall-e-3 \
  --quality hd \
  --size 1792x1024 \
  --style vivid \
  --prompt "serene mountain landscape at sunset, photorealistic"

DALL-E 3はn=1制限のため、複数画像生成時はスクリプトが自動的にループ実行する。

4. バッチ処理によるアセット生成

プロンプトリストファイル（prompts.txt）を使用した一括生成:

cat > prompts.txt << 'EOF'
futuristic cityscape at night
retro 80s neon sign
minimalist abstract art
vintage travel poster
EOF

while read prompt; do
  python3 gen.py --prompt "$prompt" --count 1 --out-dir ./assets
done < prompts.txt

5. カスタムスクリプトでのAPI統合

Python環境での直接API呼び出し:

import os
from openai import OpenAI

client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))

response = client.images.generate(
  model="gpt-image-1",
  prompt="ultra-detailed photo of a steampunk robot",
  size="1024x1024",
  quality="high",
  n=4
)

for idx, image in enumerate(response.data):
  print(f"Image {idx + 1}: {image.url}")

6. Clawdbot Agentからの自動画像生成

Clawdbot AgentがOpenAI Image Gen Skillを呼び出す例:

#!/bin/bash
# Clawdbot Agent実行スクリプト

PROMPT="A futuristic AI assistant workspace with holographic displays"
OUTPUT_DIR="/tmp/clawdbot-generated-images"

python3 ~/.clawdbot/skills/openai-image-gen/scripts/gen.py \
  --prompt "$PROMPT" \
  --count 8 \
  --model gpt-image-1 \
  --quality high \
  --out-dir "$OUTPUT_DIR"

echo "画像生成完了: $OUTPUT_DIR/index.html"

ユースケース

クリエイティブワークフロー

コンセプトアート生成（ゲーム、映画、広告）
プロトタイピング用のビジュアルモックアップ
ブログ記事用のサムネイル画像生成

マーケティング・広告

ソーシャルメディア投稿用の画像素材
A/Bテスト用のバリエーション生成
プロダクトビジュアルのアイデア出し

教育・研究

視覚的教材の作成
AI画像生成の品質比較研究
プロンプトエンジニアリングの実験

自動化ワークフロー

Clawdbot Agentによる定期的なビジュアル生成
ユーザーリクエストに基づく動的画像生成
データ可視化との組み合わせ

制限事項・セキュリティ考慮事項

API制限

レート制限: OpenAI APIには1分あたりのリクエスト数制限がある（プランにより異なる）
コスト: 画像生成には従量課金が適用される。2026年2月時点の価格例（公式サイト要確認）:
- DALL-E 3 (1024x1024): 約$0.040/画像
- DALL-E 2 (1024x1024): 約$0.020/画像
- GPT Image: モデルとサイズにより変動
DALL-E 3のn=1制限: 1回のリクエストで1画像のみ生成可能

セキュリティ

APIキー管理: OPENAI_API_KEYは環境変数で管理し、ソースコードにハードコードしないこと
プロンプト内容: OpenAIのContent Policy（https://openai.com/policies/usage-policies）に準拠する必要がある。暴力的、性的、差別的なコンテンツは禁止
画像の著作権: 生成された画像の利用規約はOpenAIの利用規約に従う