Claude Code × OCR で領収書・適格請求書をデータ化する方法|インボイス対応・非エンジニア向け
目次 クリックで開く
バックオフィス業務において、いまだに根強く残る「紙資料の山」。領収書、請求書、手書きの連絡帳、あるいは古い契約書など、これらを一つひとつ手入力でExcelに転記する作業は、生産性を著しく低下させる要因です。近年、AI技術の進化によりOCR(光学文字認識)の精度は飛躍的に向上しましたが、専用ツールの導入コストや、複雑な設定が壁となり、結局「手入力が一番確実」と諦めているケースも少なくありません。
こうした状況を打破する「第3の選択肢」として注目されているのが、Anthropic社が提供するClaude Codeを活用したデータ化フローです。プログラミングの知識がなくても、対話形式でAIに指示を出すだけで、画像から正確に情報を抜き出し、構造化されたデータ(CSVやJSON)に変換することが可能になりました。
本記事では、ITの専門職ではない実務担当者の方が、Claude Codeを「最強の事務アシスタント」として使いこなし、紙資料のデータ化を完結させるための全手順を徹底解説します。
1. Claude Codeとは? 非エンジニアが知っておくべき基本仕様
Claude Codeは、Anthropic社が開発したAIアシスタント「Claude」を、コンピュータの操作画面(ターミナル)から直接利用できるようにしたツールです。最大の特徴は、AIが単にテキストを生成するだけでなく、「ファイルの中身を読み、新しいファイルを作成し、プログラムを実行する」という実務的なアクションを自律的に行える点にあります。
対話形式でファイル操作・画像解析が完結
従来のOCRツールでは、専用の画面にログインし、ボタンをクリックして画像をアップロードし、設定メニューから出力形式を選ぶ必要がありました。Claude Codeの場合、チャット欄に「このフォルダにある領収書の画像から金額と日付を抜いて、CSVにして」と打ち込むだけで、AIが画像を解析し、その場でファイルを作成してくれます。
Claude の「目」(Vision/画像認識機能)を活用
Claude Code の背後では、画像認識(Vision)に対応した Claude のモデルが動いています。Anthropic の Claude は世代を重ねるごとに画像理解の精度を高めており、単なる活字だけでなく、以下のような扱いにくい画像も高い精度で読み取ります。
- 斜めに撮影されたスマートフォンの写真
- 複雑な罫線が引かれた表形式の書類
- 人間でも読みづらい「くせ」のある手書き文字
この強力な「目」を、コマンド一つで呼び出せるのがClaude Codeの強みです。もし、経理業務全体の自動化を検討されているなら、楽楽精算×freee会計の「CSV手作業」を滅ぼす。経理の完全自動化とアーキテクチャの記事で紹介しているような、SaaS間の連携フローと組み合わせることで、さらなる威力を発揮します。
2. 準備編:Claude Codeを動かすための環境構築
「ターミナル」や「環境構築」と聞くと難しく感じるかもしれませんが、手順はシンプルです。一度設定してしまえば、あとは日常的に呼び出すだけです。
3.1. Node.jsのインストール
Claude Codeを動かすには、Node.jsという実行環境が必要です。公式サイトから推奨版(LTS)をダウンロードしてインストールしてください。
公式サイト:Node.js (https://nodejs.org/)
3.2. Anthropic APIキーの取得と設定
Claude Code は Anthropic の Pro プラン($20/月)以上のサブスクリプション、または API キーによる従量課金で利用できます。APIキーを使う場合は以下の手順で取得します。
- Anthropic Consoleにサインアップする。
- 「Get API Keys」から新しいキーを発行する。
- 発行されたキーをメモしておく(他人に教えないでください)。
3.3. Claude Codeのインストールと起動
パソコンの「ターミナル」(WindowsならコマンドプロンプトやPowerShell、Macならターミナル.app)を開き、以下のコマンドをコピー&ペーストしてエンターキーを押します。
npm install -g @anthropic-ai/claude-code
インストール完了後、claude と入力すると起動します。初回起動時にAPIキーを聞かれるので、先ほどメモしたキーを入力してください。
Claude Code OCR 環境構築ステップ早見表:作業内容・所要時間・つまずきポイント(非エンジニア向け)
「Node.jsをインストールしてAPIキーを設定する」という説明は正確ですが、非エンジニアの方にとっては「どのステップが一番難しいか」「エラーが出たときどうすればいいか」がわかりません。実際の現場では、ステップ2(APIキーの取得と設定)でAPIキーの入力場所が見つからなかったり、費用課金の仕組みが不明で不安になる方が多いです。下表は3ステップについて、具体的な作業・所要時間・よくある詰まりポイント・解決の糸口をまとめたものです。
| ステップ | 作業内容 | 所要時間の目安 | よくある詰まりポイント | 解決の糸口 |
|---|---|---|---|---|
| 3.1 Node.jsのインストール | Node.js公式サイト(nodejs.org)から「LTS版(推奨版)」をダウンロードし、画面の指示に従ってインストール。完了後にターミナルで「node -v」を実行してバージョンが表示されれば成功 | 10〜20分 | 「LTS版」と「最新版」のどちらをインストールすればよいか迷う。WindowsのPathが通らず「nodeコマンドが認識されない」エラーが出る | 「LTS版」を選べば問題なし。Pathエラーはインストーラーの「Add to PATH」チェックボックスを有効にして再インストールすると解決することが多い |
| 3.2 Anthropic APIキーの取得と設定 | console.anthropic.comにアクセスしてアカウントを作成。「API Keys」メニューから新しいキーを発行し、ターミナルで「export ANTHROPIC_API_KEY=”sk-ant-…”」として環境変数に設定(Windowsの場合はsetxコマンドを使用) | 15〜30分 | APIキーは発行直後しか全文が表示されない(コピーし忘れると再発行が必要)。従量課金への不安から「使いすぎないか」心配になる | キー発行後は必ずメモ帳に貼り付けてから保存する。Usage Limitsで月額上限を$5〜$10程度に設定しておけば課金超過の心配はなくなる |
| 3.3 Claude Codeのインストールと起動 | ターミナルで「npm install -g @anthropic-ai/claude-code」を実行してインストール。完了後に「claude」と入力して起動確認。「>」プロンプトが表示されれば動作OK | 5〜10分 | npmのアクセス権限エラー(EACCES)が出てインストールできない(Macで多い)。「claude」コマンドを実行しても「command not found」になる | Macのアクセス権エラーはnpmの公式ドキュメントの「nvm」(Node Version Manager)を使う方法で解決できる。コマンドが見つからない場合はターミナルを再起動すると解決することが多い |
3ステップの中で最初に「成功体験」を作るべきはステップ3.3の起動確認です。「claude」と入力して「>」が表示された瞬間、これまでの作業が報われます。ステップ3.1と3.2でエラーが出ても、エラーメッセージをそのままClaudeに貼り付けて「このエラーを解決する方法を教えてください」と聞くだけで、多くの場合は次の手順を教えてくれます。非エンジニアの方こそ、AIに「詰まった原因」を聞く習慣をつけることが、環境構築の最大のコツです。
3. 実践編:領収書・紙資料をデータ化するフロー
準備が整ったら、実際に資料をデータ化してみましょう。ここでは、机に散らばった「領収書」をCSVにまとめるケースを想定します。
ステップ1:資料の画像化
まずは、対象の書類をスキャナで読み取るか、スマートフォンのカメラで撮影します。ポイントは、「文字がはっきり読めること」です。多少の影や歪みはAIが補正してくれますが、ピントが合っていないものは誤変換の原因になります。
ステップ2:Claude Codeに画像を読み込ませる
画像ファイルを特定のフォルダ(例:receiptsフォルダ)にまとめます。Claude Codeのチャット画面で、次のように指示を出します。
「receiptsフォルダの中にある全ての画像ファイルを読み込んでください。それぞれの領収書に書かれている、日付、支払先、合計金額、消費税額を抽出してください。」
ステップ3:結果をCSV形式で保存する
AIが内容を表示したら、続けてこう指示します。
「抽出したデータを、
shiwake_data.csvという名前のファイルで作成して保存してください。文字コードはShift-JIS、カンマ区切りでお願いします。」
これで、表計算ソフトでそのまま開けるデータが出来上がります。もし、こうした事務作業の自動化をさらに一歩進め、プログラミングなしで業務アプリ化したい場合は、Excelと紙の限界を突破する「Google Workspace × AppSheet」業務DX完全ガイドも非常に参考になります。
4. 【比較表】主要OCRツールとClaude Codeの徹底比較
市場には多くのOCRサービスが存在しますが、Claude Codeを選択するメリットはどこにあるのでしょうか。代表的なサービスと比較しました。
| 比較項目 | Claude Code (Sonnet 4.6) | 汎用AI-OCR (SaaS型) | Google Cloud Vision |
|---|---|---|---|
| 主な対象 | 自由度の高いデータ化・分析 | 定型書類(請求書等)の大量処理 | 開発者向けのAPI利用 |
| 導入の容易さ | 中(環境構築が必要) | 高(ブラウザで完結) | 低(プログラミング必須) |
| 手書き文字精度 | 非常に高い | 高い | 標準的 |
| 料金体系 | サブスクリプション(Pro $20/月〜) または API 従量課金 |
月額固定 + 従量 | 従量課金 |
| カスタマイズ性 | 極めて高い(対話で変更可能) | 低い(設定範囲内のみ) | 高い(開発が必要) |
※料金の詳細は、各サービスの公式ページ(Anthropic Pricing等)を必ずご確認ください。
5. 実務で使えるプロンプトテンプレート
Claude Codeで高い精度を出すためには、指示(プロンプト)の書き方が重要です。そのままコピーして使えるテンプレートを紹介します。
6.1. 領収書・請求書の抽出
以下の画像から情報を抽出し、JSON形式で出力してください。 取引日(YYYY/MM/DD形式) 支払先名称 合計金額(税込) 消費税額 適格請求書発行事業者番号(もしあれば) もし読み取りが不確実な箇所があれば、その旨を注釈に含めてください。
6.2. 複雑な表形式の資料
この画像には売上明細の表が含まれています。 ヘッダー項目(品名、数量、単価、小計)を維持したまま、Markdown形式のテーブルに変換してください。 空欄のセルは「0」と記載してください。
このように詳細な指示を与えることで、AIは単なるテキスト変換を超えた「データ整形」までを一度にこなしてくれます。既存のSaaSコストを見直し、こうしたAI活用への切り替えを検討している方は、SaaSコストを削減。フロントオフィス&コミュニケーションツールの「標的」と現実的剥がし方の視点も、コスト構造の最適化に役立つはずです。
領収書から「適格請求書(インボイス)」の登録番号・税率を読み取る
「claude 適格請求書」「claude 領収書」で調べている方の多くは、単に文字を読み取るだけでなく、インボイス制度に対応した経理入力に使えるデータがほしいはずです。Claude の画像認識は、領収書・請求書から適格請求書発行事業者の登録番号(T+13桁)や、税率(8%/10%)ごとの対価・消費税額を抜き出す、といった指示にも対応できます。
たとえばプロンプトに「この画像から、日付・支払先・登録番号(Tから始まる番号)・税率ごとの金額・消費税額を抜き出してCSVにして。登録番号が見当たらない場合は『なし』と書いて」と添えると、適格請求書かどうかの一次仕分けまで含めてデータ化できます。登録番号の有無で「インボイスとして使える領収書か」を機械的に振り分けられるため、手作業での確認を大きく減らせます。
また、実務では紙だけでなくPDFの領収書・請求書も多く混在します。PDFはページを画像として書き出してから読み込ませると、紙のスキャン画像と同じ流れで処理できます。複数ページのPDFや、1枚に複数明細がある書類でも、「明細ごとに1行で」と指示すれば表形式に整えられます。
ひとつ注意したいのは、電子帳簿保存法のスキャナ保存とは目的が別だという点です。Claude による読み取りはあくまで「データの抽出」であり、改ざん防止やタイムスタンプといった電子帳簿保存法の保存要件そのものを満たすものではありません。法対応としての保存は会計ソフトや専用システムに任せ、Claude は「入力の前処理(読み取りと仕分け)を速くする道具」として位置づけると、役割を取り違えずに済みます。
インボイス(適格請求書)の番号・税率をClaude Codeで自動抽出する
2023年10月のインボイス制度開始以降、受け取った請求書が「適格請求書」であるかを確認する業務が増えています。Claude Code を活用すれば、スキャンした請求書の画像から以下の情報を自動で抽出し、帳簿入力の前処理を大幅に効率化できます。
Claude Code が適格請求書から抽出できる情報
| 項目 | インボイス要件 | Claude Code での抽出例 |
|---|---|---|
| 適格請求書発行事業者登録番号 | 必須(T+13桁) | 「T1234567890123」を認識 |
| 税率区分(8%・10%) | 必須 | 「10%対象 ○○円」「8%(軽減税率)対象 ○円」 |
| 税額(8%分・10%分それぞれ) | 必須 | 「消費税8% ○円 / 10% ○円」の個別計算 |
| 請求日・支払期日 | 必須 | YYYY-MM-DD形式で出力可 |
| 発行者名・住所 | 必須 | 名刺・スタンプ・縦書きも対応 |
適格請求書番号の照合プロンプト例
Claude Code に以下のプロンプトを渡すことで、スキャン画像から適格請求書番号を抽出し、国税庁公表のフォーマット(T+13桁)に合致するか簡易チェックができます。
この請求書画像を読み取り、以下をJSON形式で出力してください:
{
"invoice_number": "T始まり13桁の番号(なければnull)",
"tax_10_amount": "10%対象の税額(円)",
"tax_8_amount": "8%軽減税率対象の税額(円)",
"issue_date": "YYYY-MM-DD",
"issuer_name": "発行者の会社名・屋号",
"total_amount": "税込合計金額(円)",
"is_valid_invoice": "T+13桁の番号があればtrue、なければfalse"
}
バッチ処理で複数請求書を一括集計する方法
1フォルダに入った複数の請求書PDFや画像を一括処理したい場合は、以下のような指示をClaude Codeに伝えます:
invoicesフォルダ内のPDFと画像ファイルをすべて読み込み、 各ファイルからインボイス番号・税額・合計金額・発行者名を抽出して invoice_summary.csv に出力してください。 ヘッダー行を含む日本語のCSVで、文字コードはUTF-8(BOM付き)にしてください。
Claude Code はフォルダ内のファイルを自律的に列挙し、1件ずつ画像解析を実行してCSVに書き出します。従来であれば専用OCRサービスへの登録・APIキー取得・スクリプト開発が必要でしたが、自然文の指示だけで同等の処理が実現できます。
会計ソフト別CSV設計:freee・マネーフォワード・弥生にそのまま流し込む
OCRで抽出したデータを「会計ソフトに手入力」していては、自動化の意味が半減します。Claude Code に最初から会計ソフトのインポート形式でCSVを出力させれば、領収書のスキャンから仕訳取り込みまでを一気通貫で完結できます。
各ソフトのインポート用CSVは列の構成と名称がそれぞれ異なります。以下のプロンプトを渡すことで、取り込み先に合わせたCSVを生成できます。
freee 会計:仕訳インポート形式
freee の「仕訳インポート(汎用CSV形式)」は、借方・貸方の勘定科目・税区分・税額をそれぞれ列で持ちます。以下のプロンプトで freee に直接インポートできるCSVが生成できます。
invoicesフォルダ内のすべての請求書画像から情報を抽出し、 freee会計 汎用CSV形式(UTF-8)で output_freee.csv に出力してください。 ヘッダー行は以下の順で作成してください: 取引日,借方勘定科目,借方税区分,借方税金額,借方金額,貸方勘定科目,貸方税区分,貸方税金額,貸方金額,摘要,取引先 勘定科目が不明な場合は「未分類費用」にしてください。 税率区分は10%対象なら「課対仕入10%」、8%軽減なら「課対仕入8%軽」としてください。 インボイス登録番号(T+13桁)が記載されていれば摘要欄に「[T番号]」として含めてください。
マネーフォワード クラウド会計:仕訳帳インポート形式
マネーフォワードのインポートCSVには「借方インボイス」「貸方インボイス」の列があります。2023年10月以降は取引日に応じて「適格」または「80%控除」(〜2026年9月まで)の値を設定することで、仕入税額控除の区分が自動適用されます。
invoicesフォルダ内のすべての請求書画像から情報を抽出し、 マネーフォワード クラウド会計の仕訳インポートCSV(UTF-8 BOM付き)として output_mf.csv に出力してください。 ヘッダー行は以下の順で作成してください: 取引No,取引日,借方勘定科目,借方補助科目,借方部門,借方取引先,借方税区分,借方インボイス,借方金額,借方税額,貸方勘定科目,貸方補助科目,貸方部門,貸方取引先,貸方税区分,貸方インボイス,貸方金額,貸方税額,摘要,仕訳メモ ・インボイス登録番号(T+13桁)がある場合は借方インボイスを「適格」 ・T番号が見当たらない場合は「適格なし」としてください ・取引Noは連番(001,002...)で採番してください
「適格」と設定した行はマネーフォワード上で自動的に仕入税額控除の対象として処理されます。T番号の有無で振り分けを自動判定させるのがポイントです。
弥生会計:仕訳日記帳インポート形式
弥生会計の標準インポート(カンマ区切り・SJIS)は列構成がシンプルで、税区分コードを数値で指定します。Claude Code への指示では「文字コードはShift-JIS」「税区分は弥生コードで」と添えるのが確実です。
invoicesフォルダの請求書画像を読み取り、弥生会計インポート形式のCSVを output_yayoi.csv(Shift-JIS、カンマ区切り)で出力してください。 ヘッダー行: 伝票番号,伝票日付,借方科目,借方補助科目,借方税区分,借方金額,借方消費税額, 貸方科目,貸方補助科目,貸方税区分,貸方金額,貸方消費税額,摘要 税区分は 課税仕入10%→「11」、課税仕入8%軽→「43」、対象外→「0」 インボイス発行事業者番号が読み取れた場合は摘要欄に記載してください。
国税庁Web-APIで登録番号の有効性を自動照合する
Claude Code で「T+13桁の番号があればtrue」と判定できますが、それはあくまで書類上の番号の存在確認です。その番号が国税庁に実際に登録されているかどうかは、別途照合が必要です。国税庁は「適格請求書発行事業者公表システムWeb-API」を無料で提供しており、アプリケーションID(無料申請)を取得すれば、登録番号の有効性をプログラムから確認できます。
Claude Code に以下のように指示すると、OCRで抽出した番号リストを一括で照合するスクリプトを生成してくれます。
# 事前準備:国税庁Web-APIのアプリケーションIDを取得しておく # https://www.invoice-kohyo.nta.go.jp/web-api/index.html から無料申請 invoice_summary.csv のinvoice_numberカラムにあるT番号を国税庁Web-APIで照合し、 results列に照合結果(登録済み/未登録/番号不正)を追記して invoice_verified.csv として保存するPythonスクリプトを作成して実行してください。 APIエンドポイント: https://web-api.invoice-kohyo.nta.go.jp/1/invoice/ リクエスト方法: GET パラメータ t=登録番号(Tなし)&ap=アプリケーションID 応答のregistered_date(登録年月日)が取得できた場合は「登録済み」 応答エラーや空の場合は「未登録または無効」としてください。
このフローを組み合わせると、「スキャン→番号抽出→有効性照合→会計ソフト用CSV出力」までが1回の指示セットで完結します。月次の支払確認など、件数が多い場面で特に効果を発揮します。
6. 失敗しないための注意点とセキュリティ
Claude Codeは強力なツールですが、実務で運用する上ではいくつか注意すべき点があります。
7.1. 精度は「100%」ではない
AI-OCRの宿命として、数字の「1」と「7」、あるいは「0」と「6」の誤認などが稀に発生します。特に、インボイス制度に対応した税額計算など、1円の狂いも許されない業務では、「AIが作成したCSVを人間が最後にチェックする」工程を必ず組み込んでください。
7.2. トークン制限とコスト
画像データは、テキストに比べて多くの「トークン(AIが処理する情報の単位)」を消費します。一度に数百枚の画像を処理させようとすると、APIの利用制限(レートリミット)に達したり、思わぬコストがかかったりすることがあります。まずは数枚からテストし、1枚あたりの単価を把握することをお勧めします。
7.3. セキュリティと機密情報
Anthropicの公式ドキュメントによると、API経由で送信されたデータは、デフォルトでAIモデルの学習には使用されません。しかし、社内規定で「外部クラウドへのアップロード禁止」とされている情報を扱う場合は、情シス部門との調整が必要です。あくまで「業務の補助」として利用するスタンスを徹底しましょう。
7. まとめ:手入力の時間を「確認」の時間に変える
Claude Codeを活用したOCRフローの最大のメリットは、「非エンジニアでも、自分の業務に合わせて即座に自動化ツールを自作できる」点にあります。これまではエンジニアに依頼して開発してもらっていたようなスクリプトも、今ではAIと対話しながら数分で構築可能です。
紙資料からの解放は、単に「楽になる」だけではありません。空いた時間を使って、データの傾向を分析したり、より戦略的な業務に注力したりするための第一歩です。まずは手元の領収書1枚から、Claude Codeに読み込ませてみてはいかがでしょうか。
よくある質問(Claude Code × OCR)
Q. Claude CodeのOCRは無料で使えますか?
Claude Code自体の利用にはAnthropicのAPI利用料またはMax/Proプランが必要で、OCR専用の追加料金はありません。画像をClaudeに読み込ませて構造化テキスト化します。少量なら従量、継続運用ならプラン契約が現実的です。
Q. 専用OCRソフト(DX Suite等)と何が違いますか?
専用OCRは定型帳票の高速・大量処理に強い一方、Claude Codeは「読み取り+意味理解+仕訳・CSV整形まで自然文で一気通貫」できるのが違いです。非定型の領収書や雑多な紙資料、読み取り後の加工まで含めるとClaude Codeが柔軟です。
Q. 読み取り精度はどのくらいですか?
印字された領収書・請求書なら実用十分な精度で、日付・金額・適格請求書番号などの抽出に向きます。手書きや低画質は精度が落ちるため、重要項目は人間の確認(承認)を挟むフロー設計が前提です。
Q. 適格請求書(インボイス)番号も抽出できますか?
はい。登録番号(T+13桁)や税率区分・税額の抽出を指示でき、freeeやkintoneへの登録まで連携できます。制度対応では抽出結果の検証ルールを決めておくのが安全です。
Q. 会計ソフトやkintoneへの自動登録までできますか?
できます。読み取った領収書データをfreeeの取引やkintoneのレコードに登録するスクリプトをClaude Codeが生成・実行します。詳しくはClaude Code × kintone 自動化ガイドもご参照ください。AIに渡す情報・権限の統制はRuleHubやClaude Code 導入支援で設計できます。
領収書や適格請求書の画像をClaude Codeに渡す運用では、読み取りを許可するフォルダの限定と、画像内の個人情報・取引先データを誰がどの範囲まで処理してよいかの権限設計を事前に整えておくことが、情シスや法務との合意形成をスムーズにします。OCRフローのセキュア設計や実装方針のご相談は、Claude Code 導入支援でも対応しています。
経理・会計DXと仕訳/請求/債権自動化のご相談
仕訳・請求・入金消込・債権管理といった経理業務の自動化と、会計データの可視化までを一気通貫で支援します。ツール選定や既存運用の見直しについて、導入前後のセカンドオピニオンとしてもご相談いただけます。