Claude Codeの「ペアプロ」から「完全自動化」へ - Orchestrator型Skillで開発速度が劇的向上
株式会社ヘンリーのエンジニアが実践する、Claude Code Skills機能の高度な活用法。SubAgentとレビューAgentを組み合わせたOrchestrator型Skillで、情報収集→設計→実装→PR作成を完全自動化。ドメイン知識学習の時間確保に成功した実例を分析。
AIコーディングアシスタントの使い方は、多くのエンジニアが「ペアプログラミング」スタイルに留まっている。人間がAIのそばで生成されたコードを確認しながら、次の指示を出し続けるスタイルだ。
しかし、株式会社ヘンリーのソフトウェアエンジニアwarabi氏は、Claude CodeのSkills機能を活用して完全自動化への移行に成功した。その実践例から、AIコーディングツールの次世代的な使い方が見えてくる。
なぜ「ペアプロ」から脱却する必要があったのか
warabi氏が所属するヘンリーは、医療業界向けプロダクトを開発している。医療業界特有の難解なドメイン知識の理解に時間をかけたいが、実装業務も進めなければならない。時間配分が課題だった。
従来のClaude Code利用法(ペアプロ型)の問題点:
- AIによるコード変更をリアルタイムに確認する必要がある
- 会話のラリーを続けるために、生成されたコードをそのつど読む必要がある
- 人間がAIのそばを離れられない
この課題を解決するため、実装にかける時間を減らし、ドメイン知識の学習に充てる時間を増やすアプローチを模索した。
開発フローの分解と自動化可能領域の特定
warabi氏はまず、普段の業務フローを3フェーズ・7ステップに分解した。
その結果、従来ペアプロで行っていた「計画」「実装」の2ステップに加え、「情報収集」「PR作成」を含む計4ステップが完全自動化可能と判断した。
自動化対象ステップ:
- 情報収集(関連コード、ドキュメント)
- 設計(アーキテクチャ、実装方針)
- 実装(コード生成)
- PR作成(プルリクエスト作成)
Skills機能の戦略的活用 - なぜCLAUDE.mdでは不十分なのか
Claude CodeにはCLAUDE.md(プロジェクト設定ファイル)があるが、ここにワークフロー全体を書き込むとコンテキストウィンドウを圧迫する。
CLAUDE.mdは会話開始時に常に読み込まれるため、長い手順を書くほど指示が正しく実行されない確率が上がる。
Skills機能の利点:
- ワークフローを手順書のように定義
- 必要なときだけ読み込ませる(コンテキスト節約)
- 各ステップで「何を参照し、どういう判断をし、どんな出力を期待するか」を明示
CLAUDE.mdとSkillsの役割分担:
- CLAUDE.md: プロジェクトの前提知識(常時読み込み)
- Skills: 作業の進め方(必要時のみ読み込み)
この使い分けが、ペアプロ型から自動化型への移行の鍵となる。
Orchestrator型Skillの設計 - SubAgentで各ステップを独立実行
1つのSkillに全ステップを詰め込むと、またコンテキストが肥大化する。そこでwarabi氏が採用したのがOrchestrator(オーケストレーター)型Skillだ。
アーキテクチャ:
- 親Skill(Orchestrator): 各ステップの呼び出し順を管理
- 子Skill(SubAgent): 各ステップを独立したコンテキストで実行
SubAgent機能の重要性: 親Agentから独立したコンテキストで子Agentを実行する仕組み。各ステップがSubAgentとして実行されるため、ステップごとにコンテキストがリセットされる。
メリット:
- 各Skillは担当ステップの手順だけを小さなコンテキストで実行可能
- ステップ単位での修正・差し替えが容易
- コンテキスト圧迫を回避
コンテキスト管理の工夫: 情報取得AgentやDesign Agentは、結果をファイルとして保存し、Orchestratorには「処理完了」とだけ伝える。Orchestratorが調査結果を丸ごと読み込む必要がなくなり、コンテキスト圧迫を防ぐ。
レビューAgentによるフィードバックループ - 品質担保の仕組み
warabi氏はさらに、レビューAgentを追加して品質を高める仕組みを導入した。
仕組み:
- 実作業Agentが成果物を生成
- ReviewAgentが成果物をレビュー
- 問題があればOrchestratorに報告
- Orchestratorが実作業Agentに修正を依頼
- 上限回数内でループ
これは、人間の開発における「実装→コードレビュー→修正」のプロセスをAgent間で再現したものだ。
効果: 「修正不要でマージできるPRも結構作れている」とwarabi氏は報告している。
最終的なワークフロー
dev Skill(Orchestrator)の実行フロー:
- ユーザーがタスクIDを指定
- Orchestratorがタスク内容を確認
- 人間に最終確認(ここだけ人間介入)
- 以降は完全自動:
- 情報収集Agent → ReviewAgent
- 設計Agent → ReviewAgent
- 実装Agent → ReviewAgent
- PR作成Agent → ReviewAgent
- 各ステップでレビューを通過するまでループ
人間の役割:
- タスク内容の最終確認(開始時)
- PRレビュー(完了後)
実装中はVS Codeをバックグラウンドにして、他タスクの情報収集に時間を充てられるようになった。
ペアプロ型 vs 完全自動化型 - 比較結果
warabi氏自身による比較:
| 項目 | Before(ペアプロ) | After(全自動) | 評価 |
|---|---|---|---|
| 作業時間の確保 | ☓ | ◎ | 最終確認後はバックグラウンド化可能。修正不要でマージできるPRも多い |
| 開発速度 | ◯ | ◎ | 実担当Agent + レビューAgentで品質低下なし |
| 実装の理解 | ◎ | ◯ | ペアプロの方が細かい質問が可能。ただしPRレビュー時に理解を補える |
総合評価:
- ドメイン知識学習の時間確保に成功
- 開発速度も向上
- 実装理解はわずかに低下するが、PRレビューで補える
AIコーディングツール活用の進化ステージ
今回の事例から、AIコーディングツール活用には3つのステージがあることが分かる。
ステージ1: 補完型
- コード補完、部分的な生成
- 人間が主導権を完全に保持
ステージ2: ペアプロ型
- AIとの対話的な開発
- リアルタイムのフィードバック
- 人間がAIのそばにいる必要がある
ステージ3: 自動化型
- タスク指定後は完全自動
- Orchestrator + SubAgent + ReviewAgentの組み合わせ
- 人間は開始時と完了時のみ介入
現在の主流: ステージ2(ペアプロ型) 今回の事例: ステージ3(自動化型)の実現
汎用性の高いアプローチ - 実装以外にも応用可能
warabi氏は「Skillの活用は実装系業務に限らず、普段の様々な業務にも応用できる」と述べている。
応用可能な領域:
- ドキュメント生成(調査→構成→執筆→レビュー)
- データ分析(データ取得→分析→可視化→レポート作成)
- テスト自動化(テストケース設計→実装→実行→レポート)
キーとなる考え方:
- ワークフローを明確なステップに分解
- 各ステップを独立したSkillとして定義
- Orchestratorで統合
- ReviewAgentで品質担保
Claude Sonnet 4.6との相乗効果
2026年2月17日にリリースされたClaude Sonnet 4.6は、以下の改善を実現している:
- 「過剰設計が減少」
- 「指示の遵守が改善」
- 「複数ステップタスクでの一貫性向上」
これらの改善は、まさにOrchestrator型Skillの各ステップ実行において威力を発揮する。モデルの性能向上とSkillsの戦略的活用の組み合わせが、真の自動化を可能にしている。
まとめ - AIコーディングツールの次世代的活用法
warabi氏の事例が示すのは、AIコーディングツールは「使い方次第」で価値が10倍にも100倍にもなるということだ。
成功の要因:
- 業務フローの明確な分解
- Skills機能の戦略的活用
- SubAgentによるコンテキスト管理
- ReviewAgentによる品質担保
- Orchestratorによる統合
示唆される未来: Spotifyの最上級エンジニアが「12月以降コードを書いていない」と述べたように、エンジニアの役割は「コードを書くこと」から「AIを設計すること」へとシフトしつつある。
warabi氏の実践は、その未来を先取りしたものと言える。
参考リンク:
- 元記事: Claude Codeで開発を全自動化する - Orchestrator型Skillの設計と実践
- Claude Code公式: https://code.claude.com/
- Skills Documentation: https://code.claude.com/docs/en/skills
関連記事:
- Claude Sonnet 4.6リリース - Opus級の性能をSonnet価格で実現
- OpenClaw実用ユースケース29選 - コミュニティが選んだ実例集
- Spotify AI疲労問題 - 最高の開発者がコードを書かなくなった現実
関連記事
Docker Sandboxes、Claude Code等のAIコーディングエージェントを安全に実行する技術を発表
Docker公式がmicroVMベースのDocker Sandboxesを発表。Claude Code、Gemini、Codex、Kiroなどのコーディングエージェントを、プロンプトインジェクション攻撃から保護しながら実行可能に。
OpenClaw導入後の「で、何に使う?」問題を解決 - コミュニティが選んだ実用例29選
OpenClawをインストールしたものの活用法に困っている人へ。コミュニティが最低1日以上実際に運用して検証した29の実用ユースケースを分析。Daily Reddit Digest、YouTube Content Pipeline、Self-Healing Home Serverなど、生産性向上に直結する事例を紹介。
Claude Code v2.1.70 リリース - APIエラー修正とパフォーマンス改善
AnthropicがClaude Code v2.1.70をリリース。第三方ゲートウェイでのAPI 400エラー修正、Windows/WSLのクリップボード問題対応、Remote Controlポーリング頻度大幅削減など多数の改善点を含む。
人気記事
Claude Code v2.1.93 リリース - PreToolUseフック延期決定やフリッカーFREE渲染など
AnthropicがClaude Code v2.1.93をリリース。PreToolUseフックの延期決定機能、フリッカー-freeレンダリングオプション、PermissionDeniedフック、名前付きサブエージェントのタイプアヘッド対応などを含む。
Claude Code v2.1.92 リリース - forceRemoteSettingsRefreshやBedrockセットアップウィザードなど
AnthropicがClaude Code v2.1.92をリリース。forceRemoteSettingsRefreshポリシー設定、Bedrockセットアップウィザード、costコマンドの改善など多数の機能追加とバグ修正を含む。
Claude Code v2.1.84 リリース - PowerShellツールプレビューと環境設定の強化
Claude Code v2.1.84がリリース。Windows向けのPowerShellツール、環境変数によるモデル選択のカスタマイズアイドルセッション処理の改善などが含まれる。
最新記事
Claude Code v2.1.93 リリース - PreToolUseフック延期決定やフリッカーFREE渲染など
AnthropicがClaude Code v2.1.93をリリース。PreToolUseフックの延期決定機能、フリッカー-freeレンダリングオプション、PermissionDeniedフック、名前付きサブエージェントのタイプアヘッド対応などを含む。
Claude Code v2.1.92 リリース - forceRemoteSettingsRefreshやBedrockセットアップウィザードなど
AnthropicがClaude Code v2.1.92をリリース。forceRemoteSettingsRefreshポリシー設定、Bedrockセットアップウィザード、costコマンドの改善など多数の機能追加とバグ修正を含む。
Claude Code v2.1.91 リリース - MCPツール結果の永続化とEditツールの最適化
Claude Code v2.1.91ではMCPツールの結果サイズの上書き、シェル実行の制御強化、Editツールの効率改善などが行われた。