「数字がズレる」問題に終止符を。マーケ×dbtでCV/商談化指標をコード管理し、信頼できるデータ基盤を構築

「数字がズレる」問題は、マーケティング施策の意思決定を妨げます。dbtを活用し、CV/商談化指標をコードで一元管理。信頼できるデータ基盤を構築し、データドリブンな意思決定を実現する具体的な方法を解説します。

この記事をシェア:
目次 クリックで開く

「マーケティング部門が報告するCV数と、営業部門が管理する商談数が一致しない」「BIツールの数字とSalesforceの管理画面が常に数%ズレている」。BtoBマーケティングの実務において、この「数字の不一致」は意思決定を鈍らせる最大のボトルネックです。

本ガイドでは、日本最高峰のデータ基盤構築の実務知見に基づき、dbt(data build tool)を活用してCVや商談化指標をコードで一元管理し、信頼できるデータ基盤を構築する具体的な手順を解説します。

1. 「数字のズレ」を根本から断つ、マーケティングデータ基盤の設計思想

1.1 なぜ従来の集計手法ではCV数や商談化率が乖離するのか

多くの場合、数字がズレる原因は「集計場所の分散」にあります。広告媒体、Google アナリティクス 4(GA4)、Salesforce、そしてスプレッドシート。それぞれのツールが独自のタイムゾーン、独自のコンバージョン定義(ラストクリック、ファーストクリック等)で計算を行うため、結果が一致することはありません。

1.2 Excel・BIツール内計算の限界

BIツール(TableauやLooker)の計算フィールドで指標を定義すると、そのツールを使える人にしかロジックが分かりません。これが「ロジックのブラックボックス化」です。指標定義をツールから切り離し、SQLコードとして共通管理する必要があります。

関連記事:【図解】SFA・CRM・MA・Webの違いを解説。高額ツールに依存しない『データ連携の全体設計図』

2. dbtを中核としたモダンデータスタックのツール選定と比較

信頼できるデータ基盤(モダンデータスタック)を構築するには、データの「運搬」「蓄積」「変換」を担う最適なツール選定が不可欠です。2026年現在の主要スペックを比較します。

主要データ基盤ツールの機能・料金比較(2026年時点)
ツールカテゴリ 製品名 主な特徴 料金目安 公式導入事例
データ変換 (Transformation) dbt Cloud SQLによるモデル管理、自動テスト、Semantic Layer機能 Developerプラン:$0〜

Enterprise:個別見積

HubSpot公式事例
データ統合 (ELT) Fivetran 500以上のSaaSコネクタ。Salesforce連携に強み 従量課金(MARベース) Salesforce公式事例
DWH BigQuery Google Cloudの強力な分析基盤。GA4連携がスムーズ アクティブストレージ:$0.02/GB

計算:従量課金

メルカリ公式事例
リバースETL Hightouch DWHの指標をSalesforce等のSaaSに書き戻す Freeプラン有り

Starter:$350/月〜

Spotify公式事例

3. 【実践】dbtによるCV/商談化指標のコード管理ステップ

dbtを用いて、生データを信頼できる指標へと変換する3つのレイヤー構造を構築します。

3.1 Staging層:生データのクレンジング

Salesforceの Opportunity テーブルやGA4のイベントデータをそのまま使うのではなく、まずはデータ型を整え、不要なカラムを削除します。

  • タイムゾーンの統一: UTCをJST(+9時間)に変換。
  • NULL値の処理: 欠損値がある場合のデフォルト値設定。

3.2 Intermediate層:名寄せと重複排除

「Webの問い合わせ(Email)」と「Salesforceのリード(Email)」を紐づける「名寄せ」を行います。ここで、1人のユーザーが複数回問い合わせた場合の「ユニークCV数」の定義を確定させます。

3.3 Mart層:ビジネス指標の定義とテスト

最終的なBIツールが参照するテーブルです。ここではじめて 商談化率 = 商談数 / 有効リード数 といった計算ロジックを記述します。dbtの generic test を使い、商談化率が100%を超えるといった異常値が発生した際に自動アラートを飛ばす設定を組み込みます。

関連記事:高額なCDPは不要?BigQuery・dbt・リバースETLで構築するモダンデータスタック

4. 現場の意思決定を加速させる「リバースETL」とBI連携

4.1 算出した「商談化スコア」をSalesforceに書き戻す

dbtで算出した「このリードの商談化確度」などの高度な指標を、Hightouch等を用いてSalesforceのカスタム項目に自動で書き戻します(リバースETL)。これにより、営業担当者はBIツールを開くことなく、いつものCRM画面で「優先すべきリード」を把握できます。

4.2 経営判断を支えるTableau/Lookerでの可視化

指標がコード管理されていれば、BIツール側で行うのは「表示」だけです。ツールの乗り換えや複数のBIツール(TableauとLooker Studioの併用など)を利用しても、数字がズレることはありません。

  • Tableau事例: セールスフォース社による自社導入事例では、全社員が共通のデータダッシュボードを参照し、共通言語で議論を行っています。

    【公式】SalesforceによるTableau活用事例

5. 実務で直面するトラブルシューティングと運用回避策

5.1 「タイムゾーンの壁」への対処法

BigQuery等のDWHはデフォルトがUTCです。dbtのモデル内で DATETIME(created_at, 'Asia/Tokyo') を徹底するか、プロジェクト全体でタイムゾーン変換のマクロを定義することを推奨します。これを行わないと、深夜帯のCVが翌日分として集計され、日次レポートが毎日ズレ続けます。

5.2 API制限(Quota)の回避設計

Fivetran等でSaaSからデータを抜く際、SalesforceのAPIリクエスト制限(API Quota)に抵触することがあります。全件取得ではなく、dbtの is_incremental() マクロを使い、前回の実行以降に更新されたレコードのみを処理する「増分更新」を設計に組み込んでください。これにより、処理時間の短縮とコスト削減が同時に実現します。

5.3 データの鮮度(Freshness)の担保

dbtの source freshness 機能を使い、例えば「Salesforceからのデータ取り込みが12時間以上止まっている」場合にエラーを出すように設定します。数字がズレているのではなく「古い」だけという初歩的な混乱を防ぐことができます。

関連記事:広告×AIの真価を引き出す。CAPIとBigQueryで構築する「自動最適化」データアーキテクチャ

まとめ:信頼できるデータが組織を強くする

「数字がズレる」問題の解決は、単なる技術的な課題解決ではありません。部門間の不信感を拭い、全社員が同じ指標を信じてアクセルを踏める環境を作る「組織変革」そのものです。dbtを核としたデータ基盤構築により、貴社のマーケティング活動を「推測」から「確信」へと変えていきましょう。

6. 導入前に確認すべき「データマネジメント」のチェックリスト

dbtによるコード管理を成功させるには、ツールを導入する前の「情報の整理」が成否を分けます。特にB2Bマーケティングでは、商談の定義が事業部ごとに異なるケースが多いため、以下の3点を事前に定義しておく必要があります。

dbt導入・運用開始前の確認項目(チェックリスト)
チェック項目 確認すべき内容 よくある失敗例
指標の計算ロジック 「有効商談」や「失注」の判定基準は全社で統一されているか? マーケ側は「電話がつながった数」、営業側は「案件化した数」を商談と呼び、数字が乖離する。
データの主キー(PK) 名寄せの鍵となる項目(Email、Cookie ID、会社ドメイン等)は決まっているか? 複数のリードソースで同一人物が重複し、CV数が過大評価される。
更新頻度とコスト データの鮮度は「リアルタイム」が必要か、それとも「1日1回」で十分か? 不要な高頻度更新を設計し、BigQueryのクエリ課金やSaaSのAPIコストが膨れ上がる。

6.1 「Semantic Layer」による定義の共通化

dbtの強力な機能の一つに「Semantic Layer(セマンティックレイヤー)」があります。これは、BIツール(TableauやLooker)ごとに記述していた計算式を、dbt側で「唯一の正解」として定義し、外部ツールから参照させる仕組みです。これにより、計算ミスによる「数字のズレ」をシステム的に排除できます。

7. データ基盤の「健康診断」を自動化する品質管理手法

「dbtを導入したのに、まだ数字が合わない」という事態を防ぐには、テスト(Generic tests / Singular tests)の徹底が不可欠です。実務では以下のテストをStaging層からMart層まで多層的に配置します。

  • unique(一意性): 主キーが重複していないか。
  • not_null(非空): 必須項目(CV日時など)が抜けていないか。
  • accepted_values(許容値): ステータスが「商談」「失注」などの想定外の値になっていないか。

これらのテストを自動化することで、上流(Salesforceの入力ミス等)で発生した異常がBIツールに反映される前に検知可能になります。より高度なデータ統合や、WebトラッキングとID連携の設計については、以下のガイドも参考にしてください。

関連記事:WebトラッキングとID連携の実践ガイド。ITP対策・LINEログインを用いたセキュアな名寄せアーキテクチャ

7.2 スモールスタートで始めるモダンデータスタック

最初からすべてのデータを統合しようとせず、まずは「最もズレて困る指標(例:広告経由の商談化数)」に絞ってdbt化することをお勧めします。基盤が整った後は、リバースETL等を用いて現場のCRMへデータを戻すことで、データ基盤への投資対効果(ROI)を早期に証明できます。

関連記事:高額MAツールは不要。BigQueryとリバースETLで構築する「行動トリガー型LINE配信」の完全アーキテクチャ

📚 関連資料

このトピックについて、より詳しく学びたい方は以下の無料資料をご参照ください:

システム導入・失敗回避チェックリスト PDF

DX推進・システム導入で陥りがちな落とし穴を徹底解説。選定から運用まで安全に進めるためのチェックリスト付き。

📥 資料をダウンロード →


なお、各種アプリのすべての機能を使用するには、Gemini アプリ アクティビティを有効にする必要があります。

ご相談・お問い合わせ

本記事の内容を自社の状況に当てはめたい場合や、導入・運用の設計を一緒に整理したい場合は、当社までお気軽にご相談ください。担当より折り返しご連絡いたします。

お問い合わせフォームへ