背景:Claude Codeの「考えています」表示とは何か

Claude Code や Claude には、拡張思考(Extended Thinking)という機能があります。これは、AIがすぐに答えを返すのではなく、いったん「ここはこう考えて、次にこれを確認して」という途中経過を文章として書き出しながら、最終的な回答にたどり着く仕組みです。拡張思考とは、AIが答えを出す前に途中の検討を文章にして見せるモードのこと、と一行でおさえておけば十分です。

画面には、薄いグレーの文字や折りたたみ式のブロックで「まず要件を整理します」「この数字を再確認します」といった独り言のような文章が流れていきます。これを見ると、AIがどんな筋道で結論に至ったのかが分かる気がして、安心感があります。難しい依頼をしたときほど、この思考の流れが見えると「ちゃんと考えてくれているな」と感じるはずです。たとえば、決算資料の要約や契約書のチェックといった神経を使う作業ほど、途中経過が見えると任せてよさそうだと感じてしまいます。

ところが、ここに大きな落とし穴があります。海外のあるブログ記事が指摘したのは、この画面に流れる思考の文章は、AIの本当の頭の中をそのまま書き写したものではない、という点でした。画面に見える思考プロセスは、AIの内部で実際に起きている計算の正確な記録ではなく、人が読みやすいように整えられた説明にすぎません。 この違いは小さく見えて、仕事で使う以上は無視できない意味を持っています。安心感を与えてくれる表示ほど、その安心が判断を甘くする方向に働きやすいからです。

何が指摘されたのか:見える思考は「本物」ではない

問題提起の核心は、シンプルです。私たちが画面で読んでいる思考の文章と、AIが実際に答えを導くために内部で行っている処理は、別物だということです。

AIの内部では、膨大な数値計算が一瞬で行われています。それは人間が読める言葉の形をしていません。一方、画面に表示される思考文は、その処理を言葉に翻訳し、さらに読みやすく整えたものです。翻訳と整形が入る時点で、それは原文のコピーではなく、要約された解説に近いものになります。場合によっては、表示用に別途生成されたり、要約されたりした文章が出ていることもあります。会議の議事録にたとえるなら、その場のすべての発言を一字一句記録したものではなく、後から要点を整理した清書版を読んでいるようなものです。

さらに踏み込んだ指摘もあります。AIが書き出した思考の筋道と、実際にその答えを選んだ理由が一致しないことがある、というものです。つまり、表向きは「Aという理由でBと結論しました」と書いていても、内部では別の要因が結論を左右していた、というケースが起こりうるのです。Anthropic自身の研究でも、AIが示す思考の説明が、答えに本当に影響した要素を必ずしも正直に映していない場合があると報告されています。

この事実は、AIを批判するためのものではありません。AIが嘘をついているというより、思考の言語化という行為そのものに限界がある、と捉えるのが正確です。人間でも、自分がなぜそう判断したのかを後から言葉にするとき、本当の理由とずれた説明をしてしまうことがあります。直感で決めた採用や値付けを、後から理屈で説明し直す場面を思い浮かべると分かりやすいはずです。AIの思考表示にも、それに近い性質があるということです。

なぜ「本物ではない」と言えるのか

仕組みの面から、もう少しだけ丁寧に見ておきます。技術の細部に立ち入る必要はありませんが、なぜ思考表示が本物の記録になりえないのか、その理由を3つの層で理解しておくと、付き合い方の判断がぶれなくなります。

第一に、内部の処理は言葉ではありません。AIの中では数値の計算が行われているだけで、そこに「まず要件を整理します」という日本語の文が存在しているわけではないのです。だから、表示文は処理の写しではなく、処理を後から言葉に置き換えたものになります。

第二に、表示のために整える工程が入ります。生の途中経過は冗長で読みにくいため、ツール側で要約したり、体裁を整えたりすることがあります。私たちが見ているのは、いわば編集後の文章です。編集が入れば、元のニュアンスが落ちたり、順序が組み替えられたりします。新聞記者が取材メモを記事の形に直すとき、事実の骨子は残っても表現は別物になるのと同じです。

第三に、思考文と最終回答が別々に作られている可能性があります。思考の文章を書く処理と、実際に答えを決める処理が完全に同じとは限らないため、両者の間にずれが生まれる余地があります。だからこそ、表示された思考を読んで納得しても、最終成果物がその通りである保証はないのです。

思考表示の3つの層

この3層を頭に置くと、何を信じて何を確かめるべきかがはっきりします。信頼すべきは画面に流れる思考の文章ではなく、最終的に出てきた成果物そのものです。 思考表示は、その成果物にたどり着くまでの参考情報として読む、という距離感が正解になります。

非エンジニアにとっての本当の意味

ここまでの話を、技術の話としてではなく、仕事の話として読み替えてみます。経営者やバックオフィス担当にとって、この事実が効いてくるのは「説明責任」と「記録」の場面です。

たとえば、AIに資料を作らせて、その思考表示に「最新の四半期データを参照しました」と書いてあったとします。これを根拠に「最新データに基づいています」と社内や取引先に説明したら、どうなるでしょうか。もし実際には古いデータが使われていたら、思考表示の文章はあなたの説明を裏付ける証拠になりません。思考文は、AIが実際にやったことの保証書ではないからです。役員会で「AIがそう言ったので」という説明が通らないのと同じ理屈です。

同じことは、記録や監査の場面でも起こります。何かトラブルが起きたとき「AIがこう考えたから、こう判断した」と思考表示のログを残しておけば説明がつく、と考えるのは危険です。その文章は、後から整えられた説明であり、内部の実際の処理とずれている可能性がある以上、責任の所在をはっきりさせる記録にはなりません。税務調査や取引先からの問い合わせのように、後から経緯を厳密に問われる場面では、特にこの弱さが表面化します。

つまり、非エンジニアが押さえるべき結論はこうです。AIの思考表示は、仕事の判断を助ける便利な参考情報であって、判断の根拠そのものではない、ということです。発想を広げたり、見落としに気づいたりするためには役立ちます。けれど、対外的に「これが正しい」と保証する局面では、表示文ではなく、出てきた成果物の中身を人が確かめる必要があります。AIの思考表示は意思決定の参考にはなっても、説明責任を肩代わりしてくれる証拠にはならない、ここが分かれ目です。

業種別の活用シーン

抽象論だけでは仕事に落ちないので、具体的な現場を3つ挙げます。いずれも、思考表示を上手に使いつつ、最後は人が検証するという形に落とし込んだ例です。

ひとつ目は、従業員30人ほどの製造業で経理を担当している方のケースです。月次の経費精算を整理するため、Claude Codeに領収書データの一覧から科目分類の下書きを作らせます。思考表示には「交通費と会議費の境界が曖昧なため、金額と日付から判断しました」と流れ、なるほどと感じます。しかしここで止まってはいけません。思考文は判断の理由を語っているように見えても、実際の分類結果とずれていることがあるからです。だから経理担当の方は、思考の説明を分類の意図を読むヒントとして使いつつ、最終的に出力された科目の一覧そのものを、自社の経理ルールと突き合わせて一件ずつ確認します。特に金額の大きい接待交際費や、税区分が絡む項目は、思考文がどれだけ丁寧でも必ず人の目を通します。思考文を信じるのではなく、出てきた表を検証する、この順番が事故を防ぎます。

ふたつ目は、社労士事務所で就業規則の改定案を扱う場面です。法改正に合わせた条文の修正をAIに下書きさせると、思考表示に「育児介護休業法の改正点を反映しました」と書かれます。ここで安心して顧問先にそのまま渡したら、専門家としての信用に関わります。思考表示の文章は、AIが本当に最新の条文を正確に反映したことの証明にはなりません。そこで社労士の方は、思考文を改定の論点を素早くつかむための索引として読み、実際の条文の文言や施行日は、必ず一次情報である法令や行政の資料に当たって裏取りします。AIは検討のたたき台を速く作る相棒であって、最終確認の責任を負う主体ではない、という線引きが大切です。

みっつ目は、10人規模のマーケティング会社で、クライアント向けの市場分析レポートを作るケースです。AIに競合の動向をまとめさせると、思考表示に「複数の公開情報を比較して傾向を抽出しました」と流れ、説得力を感じます。けれど、その思考文に出てくる数字や固有名詞が、出典のある事実なのか、もっともらしく生成されたものなのかは、文章を読んだだけでは区別できません。マーケ担当者は、思考表示を切り口やストーリーの組み立て方を借りるために使い、レポートに載せる数値や引用は一つずつ出典を確認してから載せます。シェアや市場規模のような、クライアントが意思決定に使う数字ほど、必ず元の調査資料までさかのぼって確かめます。クライアントに提出する成果物の正確さは、最終的に人が担保する、という運用にしておけば、AIの速さと信頼性を両立できます。

そのまま使える実践手順

では、明日から具体的にどう運用すればよいか。難しい設定は不要で、習慣として4つの手順を回すだけです。

最初に、思考表示を読む目的を切り替えます。「AIが正しくやった証拠」を探すために読むのをやめ、「自分が見落としている視点はないか」を拾うために読む、と意識を変えます。同じ文章でも、目的が変われば受け取り方が変わります。前者は危険で、後者は安全です。

次に、最終成果物を必ず開いて中身を確認します。思考表示で納得しても、出力されたファイルや文章そのものを開き、数字・日付・固有名詞・条文といった事実に関わる部分を重点的に見ます。事実は、思考文ではなく成果物の中に書かれているからです。チェックする箇所をあらかじめ決めておくと、忙しいときでも確認を飛ばしにくくなります。

三つ目に、事実部分は一次情報で裏取りします。AIが触れた数字や引用は、社内の元データ、公式サイト、法令、行政資料などで突き合わせます。ここを省くと、もっともらしい誤りがそのまま外に出ていきます。

四つ目に、対外的に出す前に人の承認を一段挟みます。誰がいつ何を確認したかを軽く記録しておけば、それが本当の意味での説明責任の記録になります。AIの思考表示ではなく、人の確認こそが証拠です。

思考表示との付き合い方

この4手順は、AIを使わない従来の業務でも本来やっていたはずの確認作業です。AIが速くなったぶん、確認を飛ばしたくなる誘惑が強まっているだけで、やるべきことの本質は変わっていません。AIを導入しても、最終的な事実確認の責任を人が手放さない、この一線さえ守れば思考表示は強力な味方になります。

注意点とよくある誤解

最後に、つまずきやすい誤解をいくつか正しておきます。

ひとつ目の誤解は「思考表示が見えるなら、見えないAIより信頼できる」というものです。思考が見えること自体は、理解を助けてくれる良い機能です。しかし、見える思考が本物の記録でない以上、見えるからといって出力が正確になるわけではありません。透明に見えることと、正確であることは別の話だと分けて考える必要があります。

ふたつ目は「思考表示に嘘が書いてあるなら、AIは使えない」という極端な反応です。これも行きすぎです。思考文が内部処理の完全な写しでないのは事実ですが、検討の方向性や論点の整理には十分役立ちます。問題は機能ではなく、それを証拠として扱ってしまう使い方の側にあります。道具の限界を知った上で、得意な部分に使えばよいだけです。

三つ目は「長く詳しく考えているほど、答えも正しい」という思い込みです。思考表示が長く丁寧に見えても、それは説明が丁寧なだけで、結論の正しさとは直結しません。むしろ、もっともらしい長文に引きずられて検証が甘くなる方が危険です。文章の量や雰囲気ではなく、成果物の中身で判断してください。

加えて、社内でAIを使う際は、この性質をチームの共通認識にしておくことをおすすめします。一人が分かっていても、別の担当者が思考表示を証拠として保存していたら、組織としては同じリスクを抱えたままです。AIの思考表示は参考、最終確認は人、という原則を簡単なルールにして共有しておくと、属人的なミスを減らせます。新しく入った担当者や、AIを使い始めたばかりのメンバーにこそ、最初に伝えておきたいルールです。

まとめ

Claude Code の拡張思考で流れる「考えています」という文章は、便利で安心感のある表示です。けれど、それはAIの本当の頭の中をそのまま映したものではなく、読みやすく整えられた説明であり、ときには実際の答えと食い違うこともあります。だからこそ、思考表示は発想や論点を借りるためのヒントとして読み、事実に関わる部分は最終成果物を開いて一次情報で裏取りし、対外的に出す前には人の確認を一段挟む、という運用が欠かせません。

AIは、検討のたたき台を圧倒的な速さで作ってくれる相棒です。その速さを活かしながら、最終的な事実確認と説明責任だけは人が手放さない。この一線を守れば、思考表示の限界を正しく理解した上で、安心してAIを仕事に組み込めます。透明に見えることと正確であることを切り分けて使う。これが、非エンジニアがAIと長く付き合っていくうえでの、地味だけれど効く心構えです。


Claude を自社の業務にどう組み込めばいいか、どこを人が確認すべきか、自社のケースに当てはめて整理したい方へ。Claude Works では、非エンジニアの経営者・担当者向けに無料30分のオンライン相談を行っています。今の業務の進め方をお聞きし、AIに任せる部分と人が確認する部分の線引きまで、具体的にご提案します。お気軽にお申し込みください。