月に何度も Claude Code を使っていると、ある日 Anthropic からの請求書を見て驚く方がいます。「先月は1万円以下だったのに、今月は3万円を超えている」——そんな経験をしているのは、決してあなただけではありません。

10〜50人規模の会社で、バックオフィス業務や営業資料の作成に Claude Code を活用している担当者の方から、「費用を抑えたいけど何から手をつければよいかわからない」という声をよく耳にします。

Claude Code(AIが自動でコードや文章を書いてくれるツール)は、使うたびに「トークン(AIが読み書きする文字の単位)」を消費し、その量に応じて料金が発生します。逆に言えば、トークンの消費を上手に管理するだけで、同じ作業をしながら月額費用を半分以下に抑えることも十分可能です。

この記事では、難しい設定なしに今日から実践できるコスト削減の方法を、具体的な数字と手順で紹介します。

図: Claude Codeのコスト構造の全体像(画像生成待ち)

まず知っておきたい「なぜ費用が膨らむのか」

Claude Code の料金は、大きく3つの要素で決まります。

1つ目は「どのモデルを使うか」。Claude には Opus(高性能・高コスト)、Sonnet(バランス型)、Haiku(軽量・低コスト)という3種類があり、同じ作業をしても選ぶモデルによって料金が数倍〜十数倍変わります。

2つ目は「どれだけの情報をAIに渡すか」。AIは毎回の会話で、これまでのやりとりや読み込んだファイルの内容をすべて「記憶」として参照します。記憶が増えるほど、処理するトークン数も増え、費用が上がります。

3つ目は「キャッシュ(一時保存)が効いているかどうか」。Claude API(アプリとClaudeをつなぐ仕組み)には、同じ情報を5分以内に再利用するとコストが約10分の1になる「プロンプトキャッシュ」機能があります。この機能を活かせているかどうかで、費用が大きく変わります。

この3点を意識して運用を変えるだけで、多くの方が月額費用を30〜50%削減できています。

ステップ1: モデルを用途に合わせて選ぶ

最も即効性のあるコスト削減は、モデルの使い分けです。

Opus は複雑な戦略立案や長文の分析に向いていますが、料金は Sonnet の約3倍、Haiku の約15倍です。「簡単なメールの文章を整えてほしい」「表のデータを整理してほしい」といった日常業務には、Sonnet か Haiku で十分対応できます。

Claude Code の設定ファイル(設定を記録しておくテキストファイル)に以下を書いておくと、普段使いのモデルと、裏側で動く補助処理のモデルを分けて指定できます。

{
  "model": "claude-sonnet-4-6",
  "env": {
    "ANTHROPIC_SMALL_FAST_MODEL": "claude-haiku-4-5-20251001"
  }
}

ANTHROPIC_SMALL_FAST_MODEL(コミットメッセージの自動生成や要約など、裏側で動く軽い処理に使うモデルを指定する設定)を Haiku にするだけで、バックグラウンド処理のコストを大幅に下げられます。

また、作業の内容によって途中でモデルを切り替えることもできます。複雑な企画書を書くときは Opus、日常的なメール文案なら Sonnet、という使い方が効果的です。

/model claude-sonnet-4-6

このコマンド(AIへの命令文)を入力するだけで、その会話から使うモデルが切り替わります。

図: Opus・Sonnet・Haikuのコスト・用途比較(画像生成待ち)

ステップ2: キャッシュを壊さない使い方をする

プロンプトキャッシュ(一度AIに読ませた情報を一時保存し、再利用するときのコストを下げる仕組み)は、Claude Code が自動で活用しています。ただし、使い方次第でこのキャッシュが無効になり、毎回フルコストを払うことになります。

キャッシュを活かすための3つのポイントを押さえましょう。

ポイント1: 会話を細切れにしない。キャッシュは5分以内に同じ情報が再利用されると有効になります。少し考えてから続きを聞こうと長時間席を外すと、その間にキャッシュが切れてしまいます。連続して作業するほど費用対効果が上がります。

ポイント2: /clear コマンドの使いすぎに注意する。/clear(会話の記憶をリセットするコマンド)を頻繁に使うと、せっかく蓄積されたキャッシュも消えてしまいます。新しい全く別のテーマに切り替えるときだけ使うようにしましょう。

ポイント3: CLAUDE.md の編集タイミングを選ぶ。CLAUDE.md(プロジェクトのルールや背景情報をまとめたファイル)を編集すると、そのファイルを使ったキャッシュが無効になります。セッションの最初か最後にまとめて編集するのが効率的です。

実際に、キャッシュヒット率(一時保存を活用できている割合)が10%から60%に改善しただけで、月額費用が約4割減ったというケースもあります。

ステップ3: CLAUDE.mdをすっきりさせる

CLAUDE.md(プロジェクトの情報や指示をまとめたファイル)は、AIとの会話のたびに毎回読み込まれます。このファイルが長ければ長いほど、毎回の通信コストが増えます。

例えば、1,000行の CLAUDE.md を使って1日100回会話すれば、それだけで膨大なトークンが無駄になります。理想的な長さは200行以内です。

内容を絞り込む方法として、詳細なルールや手順は別のファイルに書き出し、CLAUDE.md からはその場所だけを記す方法があります。

# プロジェクト名

## 基本構成
- Next.js + TypeScript + Supabase

## ルール
@./docs/writing-rules.md
@./docs/tone-guide.md

@(アットマーク)でファイルを参照する形式にすると、詳細ファイルは必要なときだけ読み込まれ、毎回は送信されません。普段の会話では「軽い」CLAUDE.md だけが使われるため、コストを抑えながら必要な情報は保持できます。

以前のタスクのメモ、一時的なお願い、もう使わなくなったルールは定期的に削除する習慣をつけると、自然と200行以内に収まります。月に一度、CLAUDE.md の棚卸しをするだけで、コストを数千円単位で削減できることがあります。

ステップ4: 調査タスクは別部屋でやらせる

大量のファイルを調べたり、広い範囲で検索したりするタスクをメインの会話でそのまま実行すると、調べた内容がすべて会話の記憶として残り続けます。その後の会話が全部コスト増になってしまうのです。

こうしたケースには、サブエージェント(メインの会話とは独立した、別の文脈で動くAI)を活用する方法が便利です。

サブエージェントは「別部屋で調査してきてもらい、結果だけを報告してもらう」イメージです。1,000行のファイルを読んでも、メインの会話に戻ってくるのは「要点3行」だけ、というように動きます。

---
name: researcher
description: 調査・検索専用エージェント
tools: Read, Grep, Glob
---

指定された内容を調査し、要点のみを200字以内で報告してください。
冗長な引用は避け、場所(ファイル名・行番号)で示してください。

このファイルを .claude/agents/ フォルダに置くだけで、この範囲を調べておいて、このエラーの原因を探して、といった調査をメインの会話を汚さずに実行できます。

調査系タスクをサブエージェント化するだけで、メインセッションのトークン消費が30〜40%減るケースも珍しくありません。

図: コスト最適化の実践フロー(画像生成待ち)

ステップ5: 費用を見える化して継続的に確認する

どんな工夫も、効果を測らなければ改善できません。Claude Code には、現在のセッションの費用を確認するコマンドがあります。

/cost

このコマンドを入力すると、入力トークン数・出力トークン数・キャッシュヒット率・推定費用がまとめて表示されます。キャッシュヒット率が20%以下なら、会話の仕方や CLAUDE.md の編集タイミングを見直すサインです。

また、Anthropic Console(利用状況を管理するWebサービス)では、日ごと・モデルごとの費用内訳を確認できます。Opus の利用割合が思ったより多い、特定の日に費用が急増している、といったことに気づけると、次の改善につなげやすくなります。

さらに、出力されるトークン数に上限を設定することもできます。

export CLAUDE_CODE_MAX_OUTPUT_TOKENS=8192

この設定(環境変数という、コンピュータ全体で使える設定値)を入れておくと、AIが必要以上に長い返答をすることを防げます。短めの指示や確認作業が中心なら、4096程度に絞るとコスト削減になります。

月1回のコスト棚卸し習慣を作る

コスト最適化は、一度設定して終わりではなく、定期的に見直す習慣が大切です。以下のチェックリストを月1回確認するだけで、費用の異常なふくらみを早期に発見できます。

  • CLAUDE.md の行数は200行以内か
  • /cost コマンドでキャッシュヒット率は30%以上あるか
  • Anthropic Console でモデル別の費用比率を確認したか
  • 不要になった調査メモや一時指示を CLAUDE.md から削除したか
  • よく使う調査タスクはサブエージェント化できているか

この5項目を月1回見直すだけで、費用が想定外に膨らむことをほぼ防げます。

まずは今日、/cost コマンドで現状のキャッシュヒット率を確認するところから始めてみてください。数字を見るだけで、どこに改善余地があるか自然と見えてきます。