Clawdbot Skills

OpenAI Image Gen Skill - Clawdbot向けバッチ画像生成機能

Clawdbot向けOpenAI Image Gen Skillを利用して、OpenAI Images APIによるバッチ画像生成とHTMLギャラリー自動作成を実現する方法を解説します。

投稿者: AI Tools Hub
Clawdbot OpenAI DALL-E 画像生成 API Python

OpenAI Image Gen Skill - Clawdbot向けバッチ画像生成機能

ClawdbotのOpenAI Image Gen Skillは、OpenAI Images APIを使用した画像のバッチ生成機能を提供する。ランダムプロンプトサンプラーを搭載し、複数画像の一括生成とHTMLギャラリーの自動作成が可能である。DALL-E 2、DALL-E 3、およびGPT Imageモデル(gpt-image-1、gpt-image-1-mini、gpt-image-1.5)に対応している。

概要

OpenAI Image Gen Skillは、Pythonスクリプト(gen.py)を中心とした画像生成ワークフローを提供する。プロンプトのバリエーション生成、APIリクエスト、画像ダウンロード、ギャラリーHTMLの生成を自動化し、クリエイティブワークフローを効率化する。

2026年2月時点で、OpenAIは以下の画像生成モデルを提供している:

  • DALL-E 3: 高品質画像生成(1024x1024、1792x1024、1024x1792対応)
  • DALL-E 2: 従来モデル(256x256、512x512、1024x1024対応)
  • GPT Imageシリーズ: 最新モデル(gpt-image-1、gpt-image-1-mini、gpt-image-1.5)。透過背景、WebP出力、複数サイズ対応

技術的仕様

システム要件

  • Python: Python 3.7以上
  • 環境変数: OPENAI_API_KEY(OpenAI APIキー)
  • 依存ライブラリ: openai、requests(gen.pyで自動インストール)

インストール方法

Homebrew経由でのPythonインストール(macOS):

brew install python

OpenAI APIキーの設定:

export OPENAI_API_KEY="sk-..."
echo 'export OPENAI_API_KEY="sk-..."' >> ~/.zshrc  # または ~/.bashrc

コマンドライン引数

gen.pyの主要オプション:

オプション説明デフォルト値
--count生成画像数4
--model使用モデル(dall-e-2、dall-e-3、gpt-image-1等)gpt-image-1
--size画像サイズ(モデル依存)1024x1024
--quality品質(モデル依存)high(GPT Image)/ standard(DALL-E)
--prompt固定プロンプト(指定しない場合はランダム生成)なし
--background背景(transparent/opaque/auto、GPT Imageのみ)auto
--output-format出力形式(png/jpeg/webp、GPT Imageのみ)png
--styleスタイル(vivid/natural、DALL-E 3のみ)なし
--out-dir出力ディレクトリ~/Projects/tmp/openai-image-gen-*

主要機能

モデル別パラメータ対応

各モデルは異なるパラメータセットをサポートする:

GPT Imageモデル(gpt-image-1、gpt-image-1-mini、gpt-image-1.5):

  • サイズ: 1024x1024、1536x1024(横長)、1024x1536(縦長)、auto
  • 品質: auto、high、medium、low
  • 背景: transparent(透過)、opaque(不透明)、auto
  • 出力形式: png、jpeg、webp
  • バッチ生成: --countで複数画像の同時生成が可能

DALL-E 3:

  • サイズ: 1024x1024、1792x1024、1024x1792
  • 品質: hd、standard
  • スタイル: vivid(超リアル、ドラマチック)、natural(自然な見た目)
  • 制限: 1回のリクエストで1画像のみ(n=1

DALL-E 2:

  • サイズ: 256x256、512x512、1024x1024
  • 品質: standard
  • バッチ生成: 複数画像の同時生成が可能

ランダムプロンプト生成

--promptを指定しない場合、スクリプトは構造化されたランダムプロンプトを生成する。プロンプトテンプレートには以下のバリエーションが含まれる:

  • 被写体(astronaut、lobster、dragon等)
  • スタイル(ultra-detailed studio photo、watercolor painting等)
  • ライティング(cinematic lighting、soft ambient light等)

HTMLギャラリー自動生成

生成された全画像を表示するHTMLファイル(index.html)が自動作成される。サムネイル表示、画像クリックでの拡大表示に対応。

出力ディレクトリ構成:

~/Projects/tmp/openai-image-gen-20260215-143022/
├── image-001.png
├── image-002.png
├── image-003.png
├── prompts.json
└── index.html

prompts.jsonには、各画像とプロンプトのマッピングが記録される:

{
  "image-001.png": "ultra-detailed studio photo of a lobster astronaut",
  "image-002.png": "watercolor painting of a dragon in the mountains",
  ...
}

実装例

1. GPT Imageモデルでの高品質画像生成

python3 gen.py --count 16 --model gpt-image-1 --size 1536x1024 --quality high

生成後、自動的にブラウザでギャラリーを開く:

open ~/Projects/tmp/openai-image-gen-*/index.html

2. 透過背景のロゴ画像生成

python3 gen.py \
  --model gpt-image-1.5 \
  --background transparent \
  --output-format webp \
  --prompt "minimalist tech company logo with blue gradient" \
  --count 8 \
  --out-dir ./logos

3. DALL-E 3での超高解像度画像生成

python3 gen.py \
  --model dall-e-3 \
  --quality hd \
  --size 1792x1024 \
  --style vivid \
  --prompt "serene mountain landscape at sunset, photorealistic"

DALL-E 3はn=1制限のため、複数画像生成時はスクリプトが自動的にループ実行する。

4. バッチ処理によるアセット生成

プロンプトリストファイル(prompts.txt)を使用した一括生成:

cat > prompts.txt << 'EOF'
futuristic cityscape at night
retro 80s neon sign
minimalist abstract art
vintage travel poster
EOF

while read prompt; do
  python3 gen.py --prompt "$prompt" --count 1 --out-dir ./assets
done < prompts.txt

5. カスタムスクリプトでのAPI統合

Python環境での直接API呼び出し:

import os
from openai import OpenAI

client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))

response = client.images.generate(
  model="gpt-image-1",
  prompt="ultra-detailed photo of a steampunk robot",
  size="1024x1024",
  quality="high",
  n=4
)

for idx, image in enumerate(response.data):
  print(f"Image {idx + 1}: {image.url}")

6. Clawdbot Agentからの自動画像生成

Clawdbot AgentがOpenAI Image Gen Skillを呼び出す例:

#!/bin/bash
# Clawdbot Agent実行スクリプト

PROMPT="A futuristic AI assistant workspace with holographic displays"
OUTPUT_DIR="/tmp/clawdbot-generated-images"

python3 ~/.clawdbot/skills/openai-image-gen/scripts/gen.py \
  --prompt "$PROMPT" \
  --count 8 \
  --model gpt-image-1 \
  --quality high \
  --out-dir "$OUTPUT_DIR"

echo "画像生成完了: $OUTPUT_DIR/index.html"

ユースケース

クリエイティブワークフロー

  • コンセプトアート生成(ゲーム、映画、広告)
  • プロトタイピング用のビジュアルモックアップ
  • ブログ記事用のサムネイル画像生成

マーケティング・広告

  • ソーシャルメディア投稿用の画像素材
  • A/Bテスト用のバリエーション生成
  • プロダクトビジュアルのアイデア出し

教育・研究

  • 視覚的教材の作成
  • AI画像生成の品質比較研究
  • プロンプトエンジニアリングの実験

自動化ワークフロー

  • Clawdbot Agentによる定期的なビジュアル生成
  • ユーザーリクエストに基づく動的画像生成
  • データ可視化との組み合わせ

制限事項・セキュリティ考慮事項

API制限

  • レート制限: OpenAI APIには1分あたりのリクエスト数制限がある(プランにより異なる)
  • コスト: 画像生成には従量課金が適用される。2026年2月時点の価格例(公式サイト要確認):
    • DALL-E 3 (1024x1024): 約$0.040/画像
    • DALL-E 2 (1024x1024): 約$0.020/画像
    • GPT Image: モデルとサイズにより変動
  • DALL-E 3のn=1制限: 1回のリクエストで1画像のみ生成可能

セキュリティ

パフォーマンス

  • 生成時間: DALL-E 3は高品質のため、1画像あたり10-30秒程度かかる場合がある
  • ネットワーク依存: 画像ダウンロードは生成後のURL取得とHTTPリクエストに依存
  • ストレージ: 高解像度画像(1792x1024等)は1ファイルあたり2-5MB程度

トラブルシューティング

「OPENAI_API_KEY not set」エラー:

環境変数が設定されていない。.zshrcまたは.bashrcに追加し、シェルを再起動。

「Invalid size for model」エラー:

モデルとサイズの組み合わせが無効。上記のモデル別パラメータ対応表を参照。

「Rate limit exceeded」エラー:

APIレート制限に到達。待機後に再試行するか、--countを減らす。

参考リンク


本記事の情報は2026年2月15日時点のものです。OpenAI Images APIのモデル、価格、パラメータは変更される可能性があります。最新情報はOpenAI公式サイトをご確認ください。

この記事をシェア

人気記事

Comparison

ChatGPT(OpenAI)とClaude(Anthropic)の機能比較 2026年版。コーディング・長文解析・コスト・API料金の違いを検証

ChatGPT(GPT-4o/o3)とClaude(Sonnet 4.6/Opus 4.5)を2026年時点の最新情報で比較する。コーディング能力、長文処理、日本語品質、API料金、無料プランの違いをSWE-benchなどのベンチマーク結果とともに解説する。

続きを読む →
opinion

【2026年2月20日 所感】「AIがコードを書く」は仮説から現実になった——しかし私たちはその意味をまだ消化できていない

2026年2月20日に観測したコーディングエージェント関連ニュースの総括と所感。Anthropicの自律性研究、cmux、MJ Rathbunのエージェント事故、HN「外骨格 vs チーム」論争、Stripe Minions週1000件PR、Taalas 17k tokens/sec——朝から夜までの流れを通じて見えてきた「AIがコードを書く時代」の実相を考察する。

続きを読む →
tool

868のスキルをnpx 1コマンドで——「Antigravity Awesome Skills」が主要AIコーディングエージェントの共通スキル基盤になりつつある

Claude Code・Gemini CLI・Codex CLI・Cursor・GitHub Copilotなど主要AIコーディングアシスタントを横断する868以上のスキルライブラリ「Antigravity Awesome Skills」(v5.4.0)を詳細分析。Anthropic・Vercel・OpenAI・Supabase・Microsoftの公式スキルを統合した設計思想、ロール別バンドル・ワークフロー機能、SKILL.mdによる相互運用性のアーキテクチャを解説する。

続きを読む →

他のAIツールも探す

生産性、創造性、イノベーションのための60以上のAIツールの厳選ディレクトリをご覧ください。

0 tools selected