Summarize Skill - URL・ローカルファイル・YouTube動画から要約・トランスクリプトを抽出するClawdbot拡張機能
Clawdbot向けSummarize Skillを利用して、WebページURL、ローカルファイル、YouTube動画から要約テキストやトランスクリプトを自動抽出する方法を解説します。
Summarize Skill - URL・ローカルファイル・YouTube動画から要約・トランスクリプトを抽出するClawdbot拡張機能
Clawdbot向けのSummarize Skillが提供するsummarizeコマンドにより、WebページURL、ローカルファイル(PDF、Markdown、テキストなど)、YouTube動画から要約テキストやトランスクリプトを自動抽出できる。本スキルは、複数の大規模言語モデル(LLM)に対応し、Firecrawl・Apify統合による高精度コンテンツ抽出機能を提供する。
概要
Summarize Skillは、コンテンツ要約とトランスクリプト抽出を単一のCLIツールで実現するソリューションである。Clawdbotのスキルシステムに統合されており、AIエージェントが「このリンクの内容は?」「YouTube動画を文字起こしして」といった自然言語指示を受け取り、自動的に要約またはトランスクリプトを返す仕組みを提供する。
公式サイト(https://summarize.sh)によれば、本ツールはHomebrewパッケージとして配布されており、OpenAI、Anthropic、xAI、Google Geminiなど主要なLLMプロバイダーをサポートする設計となっている。
技術的仕様
システム要件
- macOS、Linux、またはWindows(WSL2推奨)
summarizeバイナリ(Homebrew経由でインストール)- LLMプロバイダーのAPIキー(環境変数で設定)
インストール方法
Clawdbot環境では、以下のコマンドでインストールが実行される。
brew install steipete/tap/summarize
インストール後、summarizeコマンドがシステムPATHに追加される。
環境変数
以下のいずれかのAPIキーを設定する。
# OpenAI
export OPENAI_API_KEY="sk-..."
# Anthropic
export ANTHROPIC_API_KEY="sk-ant-..."
# xAI
export XAI_API_KEY="xai-..."
# Google Gemini(いずれかのエイリアスを使用)
export GEMINI_API_KEY="AIza..."
export GOOGLE_GENERATIVE_AI_API_KEY="AIza..."
export GOOGLE_API_KEY="AIza..."
オプション(高精度抽出用):
export FIRECRAWL_API_KEY="fc-..." # ブロックされたサイトの抽出
export APIFY_API_TOKEN="apify_api_..." # YouTubeトランスクリプト抽出
設定ファイル
オプションの設定ファイル: ~/.summarize/config.json
{
"model": "openai/gpt-5.2",
"length": "medium"
}
主要機能
1. URL要約
WebページのURLから要約テキストを生成する。
summarize "https://example.com" --model google/gemini-3-flash-preview
2. ローカルファイル要約
PDF、Markdown、テキストファイルなどから要約を生成する。
summarize "/path/to/document.pdf" --model google/gemini-3-flash-preview
3. YouTube動画の要約・トランスクリプト抽出
YouTube動画URLから要約またはトランスクリプトを取得する。
# 要約生成
summarize "https://youtu.be/dQw4w9WgXcQ" --youtube auto
# トランスクリプトのみ抽出
summarize "https://youtu.be/dQw4w9WgXcQ" --youtube auto --extract-only
4. 要約長の調整
出力される要約の長さを制御できる。
summarize "https://example.com" --length short
summarize "https://example.com" --length medium
summarize "https://example.com" --length long
summarize "https://example.com" --length xl
summarize "https://example.com" --length xxl
# カスタム文字数指定
summarize "https://example.com" --length 500
5. 最大出力トークン数指定
LLMの最大出力トークン数を制限する。
summarize "https://example.com" --max-output-tokens 1000
6. コンテンツ抽出のみ(要約なし)
URLからテキストを抽出するが、LLMによる要約は実行しない。
summarize "https://example.com" --extract-only
7. Firecrawl統合
JavaScriptレンダリングが必要なサイトやブロックされたサイトからコンテンツを抽出する。
summarize "https://example.com" --firecrawl always
オプション:
auto: 標準抽出が失敗した場合にFirecrawlを使用off: Firecrawlを使用しないalways: 常にFirecrawlを使用
8. JSON出力
スクリプト統合用に機械可読形式で出力する。
summarize "https://example.com" --json
実装例
例1: 複数URLの一括要約
#!/bin/bash
# ニュース記事URLのリストから要約を生成
urls=(
"https://news.example.com/article1"
"https://news.example.com/article2"
"https://news.example.com/article3"
)
for url in "${urls[@]}"; do
echo "Summarizing: $url"
summarize "$url" --length short --model google/gemini-3-flash-preview
echo "---"
done
例2: YouTube動画トランスクリプトの検索可能化
#!/bin/bash
# YouTube動画のトランスクリプトを抽出してテキストファイルに保存
VIDEO_URL="https://youtu.be/dQw4w9WgXcQ"
OUTPUT_FILE="transcript_$(date +%Y%m%d_%H%M%S).txt"
summarize "$VIDEO_URL" --youtube auto --extract-only > "$OUTPUT_FILE"
echo "Transcript saved to: $OUTPUT_FILE"
例3: Node.js統合による自動要約パイプライン
const { exec } = require('child_process');
const util = require('util');
const execPromise = util.promisify(exec);
async function summarizeURL(url, length = 'medium') {
const command = `summarize "${url}" --length ${length} --json`;
try {
const { stdout } = await execPromise(command);
const result = JSON.parse(stdout);
return result;
} catch (error) {
console.error(`Error summarizing ${url}: ${error.message}`);
throw error;
}
}
// 使用例
(async () => {
const summary = await summarizeURL('https://example.com/article', 'short');
console.log(summary);
})();
例4: PDF研究論文の自動要約
#!/bin/bash
# 複数のPDFファイルから要約を生成して1つのMarkdownファイルに統合
OUTPUT_FILE="summaries.md"
echo "# Research Paper Summaries" > "$OUTPUT_FILE"
echo "" >> "$OUTPUT_FILE"
for pdf in *.pdf; do
echo "## $(basename "$pdf" .pdf)" >> "$OUTPUT_FILE"
summarize "$pdf" --length long --model openai/gpt-5.2 >> "$OUTPUT_FILE"
echo "" >> "$OUTPUT_FILE"
echo "---" >> "$OUTPUT_FILE"
echo "" >> "$OUTPUT_FILE"
done
echo "Summaries saved to: $OUTPUT_FILE"
例5: Cronジョブによる定期的なニュース要約
# crontab -e に追加
# 毎日9:00にトップニュースを要約してメール送信
0 9 * * * /usr/local/bin/summarize "https://news.example.com/top" --length medium | mail -s "Daily News Summary" user@example.com
ユースケース
1. AIエージェントによるリンク解析
Clawdbotエージェントがユーザーから共有されたURLの内容を自動要約し、会話文脈に組み込む環境を構築できる。
2. YouTube動画の文字起こし
動画コンテンツを検索可能なテキストに変換し、ドキュメントやブログ記事として再利用する。
3. 研究論文の効率的なレビュー
大量のPDF論文から要約を一括生成し、関連研究の迅速なスクリーニングを実現する。
4. ニュースアグリゲーション
複数のニュースサイトから記事を要約し、ダイジェストレポートを自動生成する。
5. 競合分析
競合他社のブログ記事やプレスリリースを定期的に要約し、トレンド分析を効率化する。
制限事項・セキュリティ考慮事項
制限事項
- LLM APIキー必須: OpenAI、Anthropic、xAI、Google GeminiいずれかのAPIキーが必要
- YouTube動画の長さ: 長時間動画(2時間以上)のトランスクリプト抽出は失敗する可能性がある
- PDF処理: スキャンされたPDF(画像ベース)はOCR処理が必要なため、テキスト抽出精度が低下する
- API料金: LLMプロバイダーの従量課金制により、大量の要約生成はコストが発生する
- 2026年2月時点の料金例:
- Google Gemini 3 Flash: $0.075/百万入力トークン、$0.30/百万出力トークン
- OpenAI GPT-5.2: $2.00/百万入力トークン、$6.00/百万出力トークン
- 2026年2月時点の料金例:
セキュリティ考慮事項
-
APIキーの管理: 環境変数に複数のAPIキーを保存するため、以下の対策を推奨
.bashrcや.zshrcでの設定を避け、専用の認証情報管理ツール(1Password、AWS Secrets Managerなど)を使用- APIキーのローテーションを定期的に実行
-
プライベートコンテンツの送信リスク: 社内文書やプライベートPDFをLLM APIに送信する際、データがプロバイダーのサーバーに送信されることに注意
- 機密情報を含むファイルは、オンプレミスLLM(Llama、Mistralなど)の使用を検討
-
URL検証: ユーザー入力のURLをそのまま処理する場合、以下のリスクがある
- SSRF(Server-Side Request Forgery)攻撃
- マルウェア配布サイトへのアクセス
- フィッシングサイトの要約を通じた正当性の誤認
-
出力コンテンツの検証: LLMによる要約は幻覚(Hallucination)を含む可能性があるため、重要な意思決定には元ソースの確認が必要
参考リンク
- Summarize公式サイト: https://summarize.sh
- Summarize GitHubリポジトリ: https://github.com/steipete/summarize
- OpenAI API Documentation: https://platform.openai.com/docs
- Anthropic Claude API Documentation: https://docs.anthropic.com/
- Google Gemini API Documentation: https://ai.google.dev/docs
- xAI Grok API Documentation: https://docs.x.ai/
- Firecrawl: https://firecrawl.dev/
- Apify: https://apify.com/
- Clawdbot公式サイト: https://clawdbot.io/
本記事の情報は2026年2月15日時点のものです。Summarize Skillの機能、コマンド仕様、インストール方法、LLMプロバイダーのAPI料金は変更される可能性があります。最新情報は公式サイトおよびドキュメントをご確認ください。
関連記事
ClawdHub Skill - Clawdbotスキル管理を効率化
ClawdHub CLIを利用して、Clawdbotスキルの検索、インストール、更新、公開を効率化する方法を解説します。
Spotify Player Skill - ターミナルベースのSpotify再生・検索機能をClawdbotに統合
Clawdbot向けSpotify Player Skillを利用して、spogoまたはspotify_playerを通じたターミナルベースのSpotify制御を実現する方法を解説します。
OpenAI Whisper Skill - ローカル音声認識をClawdbotに統合
Clawdbot向けOpenAI Whisper Skillを利用して、APIキー不要のローカル音声認識による文字起こし・翻訳機能を実現する方法を解説します。
人気記事
ChatGPT(OpenAI)とClaude(Anthropic)の機能比較 2026年版。コーディング・長文解析・コスト・API料金の違いを検証
ChatGPT(GPT-4o/o3)とClaude(Sonnet 4.6/Opus 4.5)を2026年時点の最新情報で比較する。コーディング能力、長文処理、日本語品質、API料金、無料プランの違いをSWE-benchなどのベンチマーク結果とともに解説する。
【2026年2月20日 所感】「AIがコードを書く」は仮説から現実になった——しかし私たちはその意味をまだ消化できていない
2026年2月20日に観測したコーディングエージェント関連ニュースの総括と所感。Anthropicの自律性研究、cmux、MJ Rathbunのエージェント事故、HN「外骨格 vs チーム」論争、Stripe Minions週1000件PR、Taalas 17k tokens/sec——朝から夜までの流れを通じて見えてきた「AIがコードを書く時代」の実相を考察する。
868のスキルをnpx 1コマンドで——「Antigravity Awesome Skills」が主要AIコーディングエージェントの共通スキル基盤になりつつある
Claude Code・Gemini CLI・Codex CLI・Cursor・GitHub Copilotなど主要AIコーディングアシスタントを横断する868以上のスキルライブラリ「Antigravity Awesome Skills」(v5.4.0)を詳細分析。Anthropic・Vercel・OpenAI・Supabase・Microsoftの公式スキルを統合した設計思想、ロール別バンドル・ワークフロー機能、SKILL.mdによる相互運用性のアーキテクチャを解説する。
最新記事
AIエージェント間通信の標準化競争が始まる——AquaとAgent Semantic Protocolが同日登場
2026年2月23日、Hacker Newsに2つのAIエージェント通信プロジェクトが同日掲載された。Go製CLI「Aqua」とセマンティックルーティングを実装する「Agent Semantic Protocol」は、MCPが解決できないP2P・非同期通信の課題に取り組む。
Claude Sonnet 4.6、無料・Proプランのデフォルトモデルに——社内テストでOpus 4.5を59%の確率で上回る
Anthropicは2026年2月17日にリリースしたClaude Sonnet 4.6を、claude.aiの無料・Proプランのデフォルトモデルに設定した。価格はSonnet 4.5と同額の$3/$15 per 1Mトークン。社内評価ではコーディングエージェント用途でOpus 4.5を上回る結果が出ている。
GoogleがOpenClaw経由のGemini利用ユーザーのアカウントを永久停止——月額$250請求継続のまま
2026年2月23日、Hacker Newsで140pt/107コメントを集めたレポートによると、GoogleはOpenClaw(サードパーティクライアント)経由でGeminiを使用していたGoogle AI Pro/Ultraユーザーを予告なしに永久停止した。技術的・経済的背景を整理する。