Claude 効率化マスターガイド — トークン節約 × 精度維持

01 —

Karpathy流 4原則 / コーディングLLM失敗パターンの根絶

Andrej Karpathyが指摘したLLMの4大失敗パターンを直接潰す原則。CLAUDE.mdに書いておくだけで、無駄な往復と不要なトークン消費を大幅に削減できる。

PRINCIPLE 01

Think Before Coding

▸ 仮定するな。混乱を隠すな。トレードオフを出せ。

不明点があれば実装前に必ず確認する
複数の解釈がある場合は提示してから選択させる
より簡単なアプローチが存在する場合は提案する
混乱している場合は名前を挙げて質問する

PRINCIPLE 02

Simplicity First

▸ 最小限のコードで解決。投機的な実装は不要。

依頼された以上の機能は追加しない
1回しか使わないコードに抽象化不要
要求されていない「柔軟性」は実装しない
200行で書けたものが50行なら書き直す

PRINCIPLE 03

Surgical Changes

▸ 必要な箇所だけ触れ。自分のゴミだけ片付けろ。

隣接するコード・コメント・書式を"改善"しない
壊れていないものをリファクタしない
既存スタイルと一致させる（自分好みではなく）
関係ないデッドコードは言及するだけ、削除しない

PRINCIPLE 04

Goal-Driven Execution

▸ 成功基準を定義しろ。検証できるまでループせよ。

「バリデーションを追加」→「無効入力テストを書いてPASSさせる」
「バグを直す」→「再現テストを書いてPASSさせる」
複数ステップは計画→承認→実行の順で進める
弱い基準（"動かす"）は使わない

▸ CLAUDE.md に貼るだけで効く — コピペ用テンプレート

# ─── Karpathy Behavioral Guidelines ───────────────────────────────
# トークン節約×精度維持のための行動指針

## 1. Think Before Coding
- 不明点は実装前に質問する（仮定して進まない）
- 複数の解釈がある場合は列挙し、ユーザーに選ばせる
- より簡単なアプローチがあれば提案する

## 2. Simplicity First
- 依頼外の機能・抽象化・柔軟性を追加しない
- 「シニアエンジニアが過剰と言うか？」をテストとして使う

## 3. Surgical Changes
- 変更は依頼に直結する行のみ。それ以外は触らない
- 自分の変更で不要になったimport/変数のみ削除する

## 4. Goal-Driven Execution
- タスクを「検証可能なゴール」に変換してから実行する
- 多段階タスクは必ず計画を先に提示し承認を得る
    

02 —

トークン節約の実践技術

⚡

バッチ処理でまとめる

5つの小さなタスクを別々に送るより、1つのセッションにまとめて送る。 10ファイルを1セッションで処理する方が、10セッション×1ファイルよりトークン効率が大幅に高い。

🎯

具体的な命令で往復を減らす

「ファイルを整理して」は往復の確認コストが発生する。「PDFをDocuments/PDFsに移し、YYYY-MM-DD prefixでリネーム、90日以上古いものは削除」は1発で動く。

🗜️

/compact でコンテキストを圧縮

会話が長くなりClaudeが同じ間違いを繰り返し始めたら/compactを実行。重要な情報を保持しながら会話履歴を圧縮。新鮮なコンテキストで精度を回復する。

📋

/plan で先に計画させる

3ファイル以上・複数ステップのタスクは必ず/planモードで計画を出させる。計画を確認→調整→実行の流れで、やり直しによるトークン浪費を防ぐ。

💰

/cost で実行前にコスト確認

Proプラン（月$20）で上限が厳しい場合、/costコマンドでタスクのトークン推計を先に確認。想定の3倍かかるタスクを分割して実行できる。

🗂️

フォルダ構造を整理しておく

Coworkは論理的で予測可能なフォルダ構造で最もよく動く。混沌としたファイルシステムはClaudeが理解するための探索コストが高くなる。

▸ 具体的な命令 vs 曖昧な命令 — トークン消費の差

❌ Bad — 往復が発生しトークン浪費

「ファイルを整理して」
「メールをチェックして重要なやつ教えて」
「コードを修正して」
「バグを直す」
「動かして」

✓ Good — 1発で動きトークン最小化

「PDFを/Documents/PDFsへ移動、YYYY-MM-DD prefix、90日超は削除」
「Gmailの未読を緊急/返信必要/FYI/削除可でカテゴリ分けしてDriveに保存」
「この関数のバリデーションのみ修正。他の行は触らない」
「再現するテストを書き、それがPASSするよう修正する」
「手順1→verify→手順2→verify の計画を出してから実行」

▸ 操作別トークンコスト目安

操作	コスト	節約テクニック
曖昧な指示 → 確認往復	高い	具体的なパスと条件を最初から明記する
長い会話でのコンテキスト維持	高い	/compact を定期実行してコンテキストを圧縮
複数ファイルを個別セッションで処理	高い	バッチ命令で1セッションにまとめる
計画なし実行 → やり直し	中	/plan で先に計画→承認→実行
過度なエラーハンドリングを要求	中	Simplicity First原則で必要なもののみ指定
スケジュール化された定型タスク	低い	/schedule で自動化、オフピーク時間に実行
テンプレート化された繰り返し作業	低い	カスタム /review /strategy コマンドを作成

04 —

Claude Cowork — 40コマンド全リスト

ほとんどのユーザーが知らないCoworkの全機能。スラッシュコマンド、ファイルシステム操作、コネクター連携、コンテンツワークフロー、スケジュール自動化の5カテゴリ。

/schedule

繰り返しタスクを自動設定。「毎月曜8時にGmailをチェックし、週次ブリーフィングを/Weeklyに保存」。PCとClaude Desktopが起動中であれば無人実行。

/compact

会話が長くなりClaudeが同じミスを繰り返す前に実行。重要情報を保持しながら会話履歴を圧縮。新鮮なコンテキスト＝高精度出力。

/clear

完全リセット。会話全体を消去して新規スタート。コンテキストが汚染されすぎて修正不可能な場合に使用。混乱したエージェントと戦うより綺麗に始める方が早い。

/strategy

Product Managementプラグインのコマンド。ビジョン、ゴール、ターゲット、競合ポジションを通じた完全な戦略キャンバス。/business-model → /pricing → /plan-launch とチェーンで20分で製品戦略完成。

/review

カスタム作成可能なスラッシュコマンド。コンテンツ・コード・提案書・レポート用のレビューチェックリスト。.claude/commands/に配置すれば全セッションで利用可能。

/memory

Claudeが現在ロードしているメモリファイルとコンテキストを表示。挙動が不安定な時のデバッグツール。正しいコンテキストがロードされていないのが問題なら即座に発見できる。

/doctor

診断コマンド。Cowork環境の状態（接続済みアプリ、ロード済みスキル、利用可能なコマンド、現在のパーミッション）を表示。何かが動かない時の第一手。

/plan

Claudeを実行前に計画モードに強制。ステップバイステップの計画を作成→承認を得てから実行。複数ファイルやシステムにまたがるタスクで必須。

/cost

実行前のトークン使用量推計を表示。Proプラン（月$20）で上限が厳しい場合に特に有効。通常の3倍かかるタスクを事前に把握して分割実行が可能に。

/undo

最後のファイル操作をロールバック。間違えた？Claudeが誤ったファイルを移動した？パニックになる前に/undo。直前の操作のみ対応。

インテリジェントな一括リネーム

「/Downloadsの全ファイルをYYYY-MM-DD_説明_タイプのパターンでリネーム。日付はファイル作成日、説明はファイル内容から生成」。各ファイルを理解してリネーム。

スマート重複検出

「/Documentsと/Desktop全体の重複ファイルを検出。削除前に見つかったものを表示。近似重複（同内容・異名）は最新更新日のものを残す」。完全一致＋近似一致を検出。

カオスからフォルダ構造を生成

「/Downloadsの全ファイルを見て論理的なフォルダ構造を作成。プロジェクト別→ファイルタイプ別でグループ化。何がどこに移動したかサマリーを出す」。

古いファイルのアーカイブ

「/Projectsで90日以上更新されていないファイルを/Archive/[年]/[月]に移動。/Projects/Activeにあるものは触らない」。アクティブな作業を誤ってアーカイブしない。

テンプレート自動生成

「/Proposals/Completedの全提案書を読み、共通構造・セクション・書式を特定。同じパターンの空白テンプレートを/Templates/proposal-template.docxとして作成」。

再帰的な検索と抽出

「/ResearchのすべてのPDFで[トピック]への言及を検索。関連段落を抽出し、どのドキュメントの何ページかを記録し、1つのリサーチサマリーにまとめる」。

形式変換パイプライン

「/Contentの全.docxファイルを.md形式に変換。書式・ヘッダー・箇条書きを保持。markdownバージョンを/Content/markdownに同名で保存」。書式インテリジェンス付き一括変換。

ストレージ監査

「/Documentsを分析。上位20の大きなファイル、1GB超のフォルダ、6ヶ月未開封のファイルを削除した場合の節約容量を推計」。コンテキスト付きストレージ管理。

Gmail → 要約 → Drive

「Gmailの全未読メールをチェック。緊急/返信必要/FYI/削除可でカテゴリ分け。定型返信を下書き。全サマリーをGoogle Drive /Dailyフォルダに今日の日付で保存」。

カレンダー → 準備ブリーフ

「Google Calendarで明日の予定をチェック。各会議の参加者と会社を調査。会議ごとに1ページの準備ブリーフを作成し/Meeting-Prep/[日付]に保存」。

Slack → アクションアイテム

「過去24時間の全チャンネルのSlackメッセージを読む。自分宛のアクションアイテムを抽出。チャンネルと緊急度でソートしたタスクリストを/Tasks/slack-actions-[日付].mdに保存」。

Drive → 分析 → スライド

「Google DriveのスプレッドシートからQ3データを取得。トレンドを分析し上位3つのインサイトを特定。グラフ付き5スライドのPowerPointサマリーを作成し/Presentationsに保存」。

メールスレッド解決

「Gmailで[プロジェクト]についてのスレッドを検索。スレッド全体を読む。決定事項・未解決事項・誰が何をすべきかをサマリー化。会話を前進させるフォローアップメールを下書き」。

マルチソースレポートビルダー

「DriveのGoogle Sheetから今週の売上データを取得。Slack #salesチャンネルで今週の商談更新を確認。全情報を統合してフォーマット済み週次売上レポートをPDFとして保存」。

会議メモ配布

「/Meetingsに保存した会議メモを読む。アクションアイテムを抽出。言及された各人に対し、その人のアクションアイテムと締め切りだけを記載したメールを下書き。送信前に確認」。

クロスプラットフォーム検索

「[プロジェクト名]に関する情報を探す。Google Drive、Slackメッセージ、Gmailを検索。見つかったすべてをソース別に整理した単一ドキュメントにまとめる」。

音声メモ → 洗練された下書き

「/Voice-Notes/[ファイル名]のトランスクリプトを読む。[トピック]についてのアイデアの粗い音声録音。自然な声を保ちつつ構造を追加し1,500字の出版可能な記事に」。

会議録音 → 構造化メモ

「/Meetings/[ファイル名]のトランスクリプトを処理。決定事項、アクションアイテム（担当者+締め切り）、未解決の質問、重要な議論ポイントを含む構造化メモをmarkdownで作成」。

リサーチ → エグゼクティブブリーフ

「/Research/[プロジェクト]に12記事がある。全て読む。主要な発見を統合し、相反する見解を特定し、リサーチに基づく3つのアクション推奨を含む2ページのエグゼクティブブリーフを作成」。

提案書カスタマイザー

「/Templates/proposal.docxのテンプレートと/Clients/[名前]/brief.mdのクライアントブリーフを読む。テンプレート構造を保ちながら全セクションをこのクライアントの状況に合わせた提案書を生成」。

契約書 → 平易な日本語

「/Legal/[ファイル名].pdfを読む。主要条件、重要な締め切り、自動更新条項、責任上限、異常な点や潜在的に問題のある箇所を含む平易なサマリーを作成（法的アドバイスではない）」。

スプレッドシート → ナラティブ

「/Data/[ファイル名].xlsxを読む。非技術系オーディエンス向けのナラティブ分析を書く。上位3トレンド、調査すべき異常値、推奨アクション2つ。具体的な数字を含めながら意味を説明」。

コンテンツ再利用パイプライン

「/Content/[ファイル名].mdを読む。ツイート8本、LinkedInポスト2本、Instagramキャプション3本、件名付きニュースレターティーザーメール1本を作成。各形式を/Content/repurposed/[日付]に個別保存」。

週次ニュースレター組み立て

「今週/Content/draftsに作成した全ファイルを読む。最も優れた3本を選ぶ。各記事へのリンクと2文のティーザーを含むニュースレターを書き、イントロと締めを追加しnewsletter-[日付].mdとして保存」。

毎日 7:00 — 受信トレイゼロ処理

Gmailをチェック。未読メールをカテゴリ分け。定型返信を下書き。緊急メールにフラグ。サマリーを/Daily/inbox-[日付].mdに保存。

毎週金曜 17:00 — ファイル整理

/Downloadsをタイプ別に仕分け。ドキュメント→/Documents、画像→/Images、コード→/Projects。60日以上経過し/Importantにないものは削除。

毎週月曜 7:30 — 週次計画ブリーフ

週のカレンダーをチェック。Driveから関連準備資料を取得。Gmailで未解決アクションアイテムをスキャン。優先事項・会議・締め切りを含む週次計画を/Weekly/plan-[日付].mdに保存。

毎月1日 — 月次財務整理

/Receiptsの全レシート画像を処理。各レシートから店舗名・金額・日付・カテゴリを抽出。カテゴリ別の経費スプレッドシートを作成。カテゴリ別合計を/Finance/expenses-[月].xlsxに保存。

隔週月曜 — 競合スキャン

[競合1]・[競合2]・[競合3]の最新ニュースをウェブ検索。価格変更・製品ローンチ・採用情報をチェック。前回スキャンと比較。/Intelligence/comp-scan-[日付].mdに保存。

毎日 18:00 — 終業日誌

/Projectsで今日作成・更新したファイルを読む。達成したこと・進行中・明日対応が必要なことを記録した簡潔な作業ログを/Daily/log-[日付].mdに保存。

05 —

トークン効率化チェックリスト

タスクを実行する前にこのリストを確認。これらが習慣になれば、同じ品質のアウトプットをより少ないトークンで得られる。

✓

命令は具体的か？
ファイルパス・条件・例外・出力先を全て明記しているか。「整理して」ではなく動詞+具体的な対象を使っているか。

✓

タスクをバッチ化できるか？
複数の小さなタスクを1つのセッションにまとめられないか確認。10ファイルを個別に送るより1回でまとめる方が大幅に効率的。

✓

複雑なタスクに /plan を使ったか？
3ファイル以上・複数ステップ・複数システムにまたがる場合は必ず計画を先に出させて承認してから実行。

✓

成功基準（verify）を定義したか？
「動かして」ではなく「テストがPASSしたら成功」「このファイルが存在したら成功」という検証可能な基準を書いているか。

✓

CLAUDE.mdにガイドラインがあるか？
Karpathy 4原則（Think/Simplicity/Surgical/Goal）をCLAUDE.mdに追加済みか。一度書けば全プロジェクトで有効。

✓

会話が長くなってきたら /compact したか？
同じミスが繰り返されたり、コンテキストが失われている感覚があったら /compact で圧縮。精度が回復する。

✓

定型タスクはスケジュール化したか？
毎日・毎週繰り返すタスクは /schedule で自動化。オフピーク時間（夜・週末）にスケジュールするとスループットが高い。

✓

Simplicity First — 余計なものを要求していないか？
必要以上の抽象化・エラーハンドリング・柔軟性を要求していないか。最小限のコードで解くことがトークン節約の近道。

▸ クイックリファレンス — 状況別コマンド

# ──── 精度が落ちてきた ────────────────────────────────────
/compact        # コンテキストを圧縮して精度回復
/clear          # 完全リセット（最終手段）
/memory         # ロード済みコンテキストを確認

# ──── 複雑なタスクを実行する前 ──────────────────────────────
/plan           # 先に計画を出させる（必須）
/cost           # トークンコストを事前確認

# ──── 何かがおかしい ─────────────────────────────────────
/doctor         # 環境診断
/undo           # 最後のファイル操作をロールバック

# ──── 繰り返しタスクの自動化 ────────────────────────────────
/schedule       # 定期実行を設定

# ──── カスタムコマンドの場所 ─────────────────────────────────
.claude/commands/  # ここにファイルを置くと/review等が使える
    

06 —

Everything Claude Code (ECC) / エージェントハーネス最適化システム

Anthropicハッカソン優勝者が10ヶ月以上の実運用から構築したClaude Code最適化システム。 48エージェント・183スキル・79コマンドと、 トークンコストを60〜70%削減する設定が1つのリポジトリに集約。

▸ 最重要 — settings.json トークン最適化設定（コピペで即効き）

// ~/.claude/settings.json
{
  "model": "sonnet",           // opusからsonnetへ → コスト約60%削減。80%以上のタスクをカバー
  "env": {
    "MAX_THINKING_TOKENS": "10000",         // デフォルト31,999→10,000 → 隠れThinkingコスト約70%削減
    "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",  // デフォルト95→50 → 早期コンパクトで長セッション品質を維持
    "CLAUDE_CODE_SUBAGENT_MODEL": "haiku"   // サブエージェントにHaikuを使用 → さらにコスト削減
  }
}
    

設定	デフォルト	推奨値	効果
`model`	`opus`	`sonnet`	コスト約60%削減。コーディングタスクの80%以上をカバー
`MAX_THINKING_TOKENS`	`31,999`	`10,000`	隠れThinkingコストを約70%削減
`CLAUDE_AUTOCOMPACT_PCT_OVERRIDE`	`95`	`50`	早期コンパクトで長セッションの品質を維持
`CLAUDE_CODE_SUBAGENT_MODEL`	`sonnet`	`haiku`	サブエージェントのコストをさらに削減

▸ モデルルーティング — sonnet vs opus の使い分け

⚙ Sonnet — デフォルト（コスト低）

日常的なコーディングタスク全般
バグ修正・リファクタリング
テスト作成・ドキュメント更新
ファイル操作・検索・抽出
80%以上のタスクはこれで十分

◈ Opus — 必要な時だけ切り替え

深いアーキテクチャ設計の判断
複雑なデバッグ（原因特定が困難な場合）
トレードオフ分析が必要な設計判断
初見の大規模コードベース理解
/model opus で切り替え、完了後は /model sonnet に戻す

▸ 戦略的コンパクション — いつ /compact するか

✓ /compact すべきタイミング

▸ リサーチ・調査フェーズ完了後、実装開始前
▸ マイルストーン達成後、次のタスク開始前
▸ デバッグ完了後、フィーチャー作業継続前
▸ 失敗したアプローチ後、新しい方法を試す前
▸ コンテキストが50%を超えたあたり

✗ /compact してはいけないタイミング

▸ 実装の途中（変数名・ファイルパス・部分的な状態が失われる）
▸ 複数ファイルにまたがる変更の途中
▸ テストが通っていない状態の途中
▸ 重要なコンテキストがまだ必要な段階

▸ エージェント選択ガイド — タスク別に使うべきコマンド

やりたいこと	コマンド	使用エージェント
新機能の実装計画を立てる	`/ecc:plan "認証機能を追加"`	planner
システムアーキテクチャを設計する	`/ecc:plan` + architect agent	architect
テスト駆動で開発する	`/tdd`	tdd-guide
書いたコードをレビューする	`/code-review`	code-reviewer
ビルドエラーを修正する	`/build-fix`	build-error-resolver
E2Eテストを実行する	`/e2e`	e2e-runner
セキュリティ脆弱性を調べる	`/security-scan`	security-reviewer
デッドコードを削除する	`/refactor-clean`	refactor-cleaner
ドキュメントを更新する	`/update-docs`	doc-updater
複数エージェントで並列実行する	`/multi-plan` → `/multi-execute`	multi-agent orchestration
セッションからパターンを学習する	`/learn` または `/learn-eval`	continuous-learning-v2
検証ループを実行する	`/verify`	verification-loop

▸ インストール方法（2分で完了）

# ── Step 1: プラグインとしてインストール（推奨）────────────────────
/plugin marketplace add https://github.com/affaan-m/everything-claude-code
/plugin install everything-claude-code@everything-claude-code

# ── Step 2: Rulesを手動でコピー（必須 — プラグインでは自動配布不可）──
git clone https://github.com/affaan-m/everything-claude-code.git
mkdir -p ~/.claude/rules
cp -R everything-claude-code/rules/common ~/.claude/rules/
cp -R everything-claude-code/rules/typescript ~/.claude/rules/  # スタックに合わせて選択

# ── Step 3: 最適化設定を追加 ──────────────────────────────────────
# ~/.claude/settings.json に以下を追記
{
  "model": "sonnet",
  "env": {
    "MAX_THINKING_TOKENS": "10000",
    "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "50",
    "CLAUDE_CODE_SUBAGENT_MODEL": "haiku"
  }
}

# ── 確認 ──────────────────────────────────────────────────────────
/plugin list everything-claude-code@everything-claude-code
# → 48エージェント・183スキル・79コマンドが利用可能になる
    

⚠ CRITICAL — コンテキストウィンドウ管理

MCPサーバーを多く有効にするとコンテキストウィンドウが激減する。各MCPのツール定義が200kウィンドウを消費し、最悪70kまで縮小する。
プロジェクトごとに有効なMCPを10以下・アクティブツールを80以下に保つこと。

// プロジェクトの .claude/settings.json
{ "disabledMcpServers": ["supabase", "railway", "vercel"] }

▸ 注目スキル — トークン効率に直結するもの

🧠

strategic-compact

論理的な区切り点で /compact を提案するスキル。95%自動コンパクトに頼らず、品質を保ちながら早期圧縮を促す。

🔁

continuous-learning-v2

セッションからパターンを自動抽出して再利用可能なスキルに変換。/learn → /evolve で知識を蓄積。

💡

cost-aware-llm-pipeline

LLMコスト最適化・モデルルーティング・予算トラッキングのパターン集。タスクの複雑度に応じて自動でモデルを選択。

🔍

search-first

コーディング前にリサーチを必須とするワークフロー。仮定で進む前に最新のドキュメントや既存実装を確認する。

✅

verification-loop

ビルド・テスト・Lint・型チェック・セキュリティを含む継続的検証ループ。/checkpoint → /verify でゴール駆動実行を実現。

🛡

AgentShield（/security-scan）

CLAUDE.md・settings.json・MCPコンフィグ・フックのセキュリティ脆弱性を1282テスト・102ルールでスキャン。

▸ 実践的なワークフロー — 新機能追加から本番リリースまで

# ── フィーチャー開発フロー ────────────────────────────────────────── /ecc:plan "ユーザー認証をOAuthで追加" → planner: 実装ブループリントを生成 /tdd → tdd-guide: テスト先行を強制（RED→GREEN→IMPROVE） /code-review → code-reviewer: 品質・セキュリティチェック # ── バグ修正フロー ────────────────────────────────────────────────── /tdd → 再現するテストを書き、それがPASSするよう修正 /code-review → リグレッションがないことを確認 # ── 本番リリース前 ─────────────────────────────────────────────────── /security-scan → OWASP Top 10 監査 /e2e → 主要ユーザーフローのE2Eテスト /test-coverage → カバレッジ80%以上を確認 # ── セッション中のコスト管理 ───────────────────────────────────────── /cost → トークン使用量をモニタリング /compact → 論理的な区切りで実行（実装途中はNG） /model sonnet → デフォルトはsonnet（80%のタスク対応） /model opus → 深い推論が必要な時だけ切り替え

トークンを節約しながら
精度を落とさない
命令設計の全技術

Karpathy流 4原則 / コーディングLLM失敗パターンの根絶

トークン節約の実践技術

プロンプト設計の公式

Claude Cowork — 40コマンド全リスト

トークン効率化チェックリスト

Everything Claude Code (ECC) / エージェントハーネス最適化システム

トークンを節約しながら 精度を落とさない 命令設計の全技術

Karpathy流 4原則 / コーディングLLM失敗パターンの根絶

トークン節約の実践技術

プロンプト設計の公式

Claude Cowork — 40コマンド全リスト

トークン効率化チェックリスト

Everything Claude Code (ECC) / エージェントハーネス最適化システム

トークンを節約しながら
精度を落とさない
命令設計の全技術