Getting Started

Claude Codeの月額費用を半分以下にする5つの設定｜非エンジニア向けコスト削減ガイド

設定入門著者: Claude Works 編集部公開: 2026年04月12日（約2か月前）最終更新: 2026年04月16日

この記事の要点

Claude Code を使うたびに費用が膨らんで困っている方へ。モデルの使い分け（Opus・Sonnet・Haiku）、キャッシュの活かし方、設定ファイルの軽量化、調査タスクの分離、費用の見える化まで、今日から実践できる5ステップを具体的な数字と手順で解説します。うまく組み合わせれば月額API費用を30〜50%削減することも十分可能です。

この記事で学べるポイント

01モデルを用途に応じて Opus・Sonnet・Haiku で使い分けるだけで、同じ作業の費用が最大15分の1になる選択肢があります

02プロンプトキャッシュのヒット率を10%から60%に改善するだけで、月額費用が約4割削減できたケースがあります

03CLAUDE.md を200行以内に保ち、詳細ルールを@参照で外部化することで毎回の通信コストを大幅に削減できます

04調査タスクをサブエージェントに分離すると、メインセッションのトークン消費を30〜40%抑えられます

05/cost コマンドで費用をリアルタイム確認し、月1回の棚卸し習慣を作ることで費用の急増を未然に防げます

月に何度も Claude Code を使っていると、ある日 Anthropic からの請求書を見て驚く方がいます。「先月は1万円以下だったのに、今月は3万円を超えている」——そんな経験をしているのは、決してあなただけではありません。

10〜50人規模の会社で、バックオフィス業務や営業資料の作成に Claude Code を活用している担当者の方から、「費用を抑えたいけど何から手をつければよいかわからない」という声をよく耳にします。

Claude Code（AIが自動でコードや文章を書いてくれるツール）は、使うたびに「トークン（AIが読み書きする文字の単位）」を消費し、その量に応じて料金が発生します。逆に言えば、トークンの消費を上手に管理するだけで、同じ作業をしながら月額費用を半分以下に抑えることも十分可能です。

この記事では、難しい設定なしに今日から実践できるコスト削減の方法を、具体的な数字と手順で紹介します。

まず知っておきたい「なぜ費用が膨らむのか」

Claude Code の料金は、大きく3つの要素で決まります。

1つ目は「どのモデルを使うか」。Claude には Opus（高性能・高コスト）、Sonnet（バランス型）、Haiku（軽量・低コスト）という3種類があり、同じ作業をしても選ぶモデルによって料金が数倍〜十数倍変わります。

2つ目は「どれだけの情報をAIに渡すか」。AIは毎回の会話で、これまでのやりとりや読み込んだファイルの内容をすべて「記憶」として参照します。記憶が増えるほど、処理するトークン数も増え、費用が上がります。

3つ目は「キャッシュ（一時保存）が効いているかどうか」。Claude API（アプリとClaudeをつなぐ仕組み）には、同じ情報を5分以内に再利用するとコストが約10分の1になる「プロンプトキャッシュ」機能があります。この機能を活かせているかどうかで、費用が大きく変わります。

この3点を意識して運用を変えるだけで、多くの方が月額費用を30〜50%削減できています。

ステップ1: モデルを用途に合わせて選ぶ

最も即効性のあるコスト削減は、モデルの使い分けです。

Opus は複雑な戦略立案や長文の分析に向いていますが、料金は Sonnet の約3倍、Haiku の約15倍です。「簡単なメールの文章を整えてほしい」「表のデータを整理してほしい」といった日常業務には、Sonnet か Haiku で十分対応できます。

Claude Code の設定ファイル（設定を記録しておくテキストファイル）に以下を書いておくと、普段使いのモデルと、裏側で動く補助処理のモデルを分けて指定できます。

{
  "model": "claude-sonnet-4-6",
  "env": {
    "ANTHROPIC_SMALL_FAST_MODEL": "claude-haiku-4-5-20251001"
  }
}

ANTHROPIC_SMALL_FAST_MODEL（コミットメッセージの自動生成や要約など、裏側で動く軽い処理に使うモデルを指定する設定）を Haiku にするだけで、バックグラウンド処理のコストを大幅に下げられます。

また、作業の内容によって途中でモデルを切り替えることもできます。複雑な企画書を書くときは Opus、日常的なメール文案なら Sonnet、という使い方が効果的です。

/model claude-sonnet-4-6

このコマンド（AIへの命令文）を入力するだけで、その会話から使うモデルが切り替わります。

ステップ2: キャッシュを壊さない使い方をする

プロンプトキャッシュ（一度AIに読ませた情報を一時保存し、再利用するときのコストを下げる仕組み）は、Claude Code が自動で活用しています。ただし、使い方次第でこのキャッシュが無効になり、毎回フルコストを払うことになります。

キャッシュを活かすための3つのポイントを押さえましょう。

ポイント1: 会話を細切れにしない。キャッシュは5分以内に同じ情報が再利用されると有効になります。少し考えてから続きを聞こうと長時間席を外すと、その間にキャッシュが切れてしまいます。連続して作業するほど費用対効果が上がります。

ポイント2: /clear コマンドの使いすぎに注意する。/clear（会話の記憶をリセットするコマンド）を頻繁に使うと、せっかく蓄積されたキャッシュも消えてしまいます。新しい全く別のテーマに切り替えるときだけ使うようにしましょう。

ポイント3: CLAUDE.md の編集タイミングを選ぶ。CLAUDE.md（プロジェクトのルールや背景情報をまとめたファイル）を編集すると、そのファイルを使ったキャッシュが無効になります。セッションの最初か最後にまとめて編集するのが効率的です。

実際に、キャッシュヒット率（一時保存を活用できている割合）が10%から60%に改善しただけで、月額費用が約4割減ったというケースもあります。

ステップ3: CLAUDE.mdをすっきりさせる

CLAUDE.md（プロジェクトの情報や指示をまとめたファイル）は、AIとの会話のたびに毎回読み込まれます。このファイルが長ければ長いほど、毎回の通信コストが増えます。

例えば、1,000行の CLAUDE.md を使って1日100回会話すれば、それだけで膨大なトークンが無駄になります。理想的な長さは200行以内です。

内容を絞り込む方法として、詳細なルールや手順は別のファイルに書き出し、CLAUDE.md からはその場所だけを記す方法があります。

# プロジェクト名

## 基本構成
- Next.js + TypeScript + Supabase

## ルール
@./docs/writing-rules.md
@./docs/tone-guide.md

@（アットマーク）でファイルを参照する形式にすると、詳細ファイルは必要なときだけ読み込まれ、毎回は送信されません。普段の会話では「軽い」CLAUDE.md だけが使われるため、コストを抑えながら必要な情報は保持できます。

以前のタスクのメモ、一時的なお願い、もう使わなくなったルールは定期的に削除する習慣をつけると、自然と200行以内に収まります。月に一度、CLAUDE.md の棚卸しをするだけで、コストを数千円単位で削減できることがあります。

ステップ4: 調査タスクは別部屋でやらせる

大量のファイルを調べたり、広い範囲で検索したりするタスクをメインの会話でそのまま実行すると、調べた内容がすべて会話の記憶として残り続けます。その後の会話が全部コスト増になってしまうのです。

こうしたケースには、サブエージェント（メインの会話とは独立した、別の文脈で動くAI）を活用する方法が便利です。

サブエージェントは「別部屋で調査してきてもらい、結果だけを報告してもらう」イメージです。1,000行のファイルを読んでも、メインの会話に戻ってくるのは「要点3行」だけ、というように動きます。

---
name: researcher
description: 調査・検索専用エージェント
tools: Read, Grep, Glob
---

指定された内容を調査し、要点のみを200字以内で報告してください。
冗長な引用は避け、場所（ファイル名・行番号）で示してください。

このファイルを .claude/agents/ フォルダに置くだけで、この範囲を調べておいて、このエラーの原因を探して、といった調査をメインの会話を汚さずに実行できます。

調査系タスクをサブエージェント化するだけで、メインセッションのトークン消費が30〜40%減るケースも珍しくありません。

ステップ5: 費用を見える化して継続的に確認する

どんな工夫も、効果を測らなければ改善できません。Claude Code には、現在のセッションの費用を確認するコマンドがあります。

/cost

このコマンドを入力すると、入力トークン数・出力トークン数・キャッシュヒット率・推定費用がまとめて表示されます。キャッシュヒット率が20%以下なら、会話の仕方や CLAUDE.md の編集タイミングを見直すサインです。

また、Anthropic Console（利用状況を管理するWebサービス）では、日ごと・モデルごとの費用内訳を確認できます。Opus の利用割合が思ったより多い、特定の日に費用が急増している、といったことに気づけると、次の改善につなげやすくなります。

さらに、出力されるトークン数に上限を設定することもできます。

export CLAUDE_CODE_MAX_OUTPUT_TOKENS=8192

この設定（環境変数という、コンピュータ全体で使える設定値）を入れておくと、AIが必要以上に長い返答をすることを防げます。短めの指示や確認作業が中心なら、4096程度に絞るとコスト削減になります。

月1回のコスト棚卸し習慣を作る

コスト最適化は、一度設定して終わりではなく、定期的に見直す習慣が大切です。以下のチェックリストを月1回確認するだけで、費用の異常なふくらみを早期に発見できます。

CLAUDE.md の行数は200行以内か
/cost コマンドでキャッシュヒット率は30%以上あるか
Anthropic Console でモデル別の費用比率を確認したか
不要になった調査メモや一時指示を CLAUDE.md から削除したか
よく使う調査タスクはサブエージェント化できているか

この5項目を月1回見直すだけで、費用が想定外に膨らむことをほぼ防げます。

まずは今日、/cost コマンドで現状のキャッシュヒット率を確認するところから始めてみてください。数字を見るだけで、どこに改善余地があるか自然と見えてきます。

FAQ

よくある質問

Q.Claude Code の料金はどうやって確認できますか？

会話中に /cost と入力するだけで、入力・出力トークン数とキャッシュヒット率、推定費用が表示されます。また Anthropic Console（Webサービス）でも日ごと・モデルごとの費用内訳を確認できます。

Q.Opus・Sonnet・Haiku のどれを使えばよいですか？

日常的なメール文案や資料整理には Sonnet か Haiku で十分対応できます。複雑な戦略立案や長文分析には Opus が向いています。Haiku は Opus と比べて約15分の1のコストで利用できる選択肢です。

Q.Claude Code の費用が突然増えたのはなぜですか？

よくある原因は3つです。①高性能な Opus モデルを頻繁に使っている、②CLAUDE.md が肥大化して毎回大量の情報を送信している、③/clear を使いすぎてキャッシュが毎回リセットされている、のいずれかが多いです。/cost コマンドでキャッシュヒット率を確認するところから始めてみてください。

Q.設定ファイルを変更しなくてもコストを下げる方法はありますか？

あります。/model コマンドで会話中にモデルを Sonnet や Haiku に切り替えるだけでも効果があります。また、会話を細切れにせず5分以内に続けることでキャッシュが効きやすくなり、設定変更なしでもコストを抑えられます。

#コスト削減 #Claude Code設定 #API費用 #初心者向け #業務効率化 #非エンジニア

こちらも読まれています

はじめの一歩

Claude Code プレイブック（無料）

非エンジニアのための50ページ完全ガイド。インストールから業務活用まで。

無料テンプレをDL 30分無料相談

Claude Codeの月額費用を半分以下にする5つの設定｜非エンジニア向けコスト削減ガイド

まず知っておきたい「なぜ費用が膨らむのか」

ステップ1: モデルを用途に合わせて選ぶ

ステップ2: キャッシュを壊さない使い方をする

ステップ3: CLAUDE.mdをすっきりさせる

ステップ4: 調査タスクは別部屋でやらせる

ステップ5: 費用を見える化して継続的に確認する

月1回のコスト棚卸し習慣を作る

よくある質問

こちらも読まれています

ハーネスエンジニアリング完全解説｜AIエージェントの性能を最大化する環境設計の全技術

Claude Code CLI とは｜非エンジニアのための使い方完全ガイド 2026年4月版

Claude Cowork 仕事活用大全｜非エンジニアが今日から使える完全ガイドと職種別40レシピ

非エンジニア AI導入 完全ガイド 2026｜社員10〜100人の会社が3ヶ月で使いこなす8ステップと月10〜30万円の費用感

Claude Code プレイブック（無料）

非エンジニア AI導入完全ガイド 2026｜社員10〜100人の会社が3ヶ月で使いこなす8ステップと月10〜30万円の費用感