「数字がズレる」問題に終止符を。マーケ×dbtでCV/商談化指標をコード管理し、信頼できるデータ基盤を構築
「数字がズレる」問題は、マーケティング施策の意思決定を妨げます。dbtを活用し、CV/商談化指標をコードで一元管理。信頼できるデータ基盤を構築し、データドリブンな意思決定を実現する具体的な方法を解説します。
目次 クリックで開く
「マーケティング部門が報告するCV数と、営業部門が管理する商談数が一致しない」「BIツールの数字とSalesforceの管理画面が常に数%ズレている」。BtoBマーケティングの実務において、この「数字の不一致」は意思決定を鈍らせる最大のボトルネックです。
本ガイドでは、日本最高峰のデータ基盤構築の実務知見に基づき、dbt(data build tool)を活用してCVや商談化指標をコードで一元管理し、信頼できるデータ基盤を構築する具体的な手順を解説します。
1. 「数字のズレ」を根本から断つ、マーケティングデータ基盤の設計思想
1.1 なぜ従来の集計手法ではCV数や商談化率が乖離するのか
多くの場合、数字がズレる原因は「集計場所の分散」にあります。広告媒体、Google アナリティクス 4(GA4)、Salesforce、そしてスプレッドシート。それぞれのツールが独自のタイムゾーン、独自のコンバージョン定義(ラストクリック、ファーストクリック等)で計算を行うため、結果が一致することはありません。
1.2 Excel・BIツール内計算の限界
BIツール(TableauやLooker)の計算フィールドで指標を定義すると、そのツールを使える人にしかロジックが分かりません。これが「ロジックのブラックボックス化」です。指標定義をツールから切り離し、SQLコードとして共通管理する必要があります。
関連記事:【図解】SFA・CRM・MA・Webの違いを解説。高額ツールに依存しない『データ連携の全体設計図』
2. dbtを中核としたモダンデータスタックのツール選定と比較
信頼できるデータ基盤(モダンデータスタック)を構築するには、データの「運搬」「蓄積」「変換」を担う最適なツール選定が不可欠です。2026年現在の主要スペックを比較します。
| ツールカテゴリ | 製品名 | 主な特徴 | 料金目安 | 公式導入事例 |
|---|---|---|---|---|
| データ変換 (Transformation) | dbt Cloud | SQLによるモデル管理、自動テスト、Semantic Layer機能 | Developerプラン:$0〜
Enterprise:個別見積 |
HubSpot公式事例 |
| データ統合 (ELT) | Fivetran | 500以上のSaaSコネクタ。Salesforce連携に強み | 従量課金(MARベース) | Salesforce公式事例 |
| DWH | BigQuery | Google Cloudの強力な分析基盤。GA4連携がスムーズ | アクティブストレージ:$0.02/GB
計算:従量課金 |
メルカリ公式事例 |
| リバースETL | Hightouch | DWHの指標をSalesforce等のSaaSに書き戻す | Freeプラン有り
Starter:$350/月〜 |
Spotify公式事例 |
3. 【実践】dbtによるCV/商談化指標のコード管理ステップ
dbtを用いて、生データを信頼できる指標へと変換する3つのレイヤー構造を構築します。
3.1 Staging層:生データのクレンジング
Salesforceの Opportunity テーブルやGA4のイベントデータをそのまま使うのではなく、まずはデータ型を整え、不要なカラムを削除します。
- タイムゾーンの統一: UTCをJST(+9時間)に変換。
- NULL値の処理: 欠損値がある場合のデフォルト値設定。
3.2 Intermediate層:名寄せと重複排除
「Webの問い合わせ(Email)」と「Salesforceのリード(Email)」を紐づける「名寄せ」を行います。ここで、1人のユーザーが複数回問い合わせた場合の「ユニークCV数」の定義を確定させます。
3.3 Mart層:ビジネス指標の定義とテスト
最終的なBIツールが参照するテーブルです。ここではじめて 商談化率 = 商談数 / 有効リード数 といった計算ロジックを記述します。dbtの generic test を使い、商談化率が100%を超えるといった異常値が発生した際に自動アラートを飛ばす設定を組み込みます。
関連記事:高額なCDPは不要?BigQuery・dbt・リバースETLで構築するモダンデータスタック
4. 現場の意思決定を加速させる「リバースETL」とBI連携
4.1 算出した「商談化スコア」をSalesforceに書き戻す
dbtで算出した「このリードの商談化確度」などの高度な指標を、Hightouch等を用いてSalesforceのカスタム項目に自動で書き戻します(リバースETL)。これにより、営業担当者はBIツールを開くことなく、いつものCRM画面で「優先すべきリード」を把握できます。
4.2 経営判断を支えるTableau/Lookerでの可視化
指標がコード管理されていれば、BIツール側で行うのは「表示」だけです。ツールの乗り換えや複数のBIツール(TableauとLooker Studioの併用など)を利用しても、数字がズレることはありません。
- Tableau事例: セールスフォース社による自社導入事例では、全社員が共通のデータダッシュボードを参照し、共通言語で議論を行っています。
5. 実務で直面するトラブルシューティングと運用回避策
5.1 「タイムゾーンの壁」への対処法
BigQuery等のDWHはデフォルトがUTCです。dbtのモデル内で DATETIME(created_at, 'Asia/Tokyo') を徹底するか、プロジェクト全体でタイムゾーン変換のマクロを定義することを推奨します。これを行わないと、深夜帯のCVが翌日分として集計され、日次レポートが毎日ズレ続けます。
5.2 API制限(Quota)の回避設計
Fivetran等でSaaSからデータを抜く際、SalesforceのAPIリクエスト制限(API Quota)に抵触することがあります。全件取得ではなく、dbtの is_incremental() マクロを使い、前回の実行以降に更新されたレコードのみを処理する「増分更新」を設計に組み込んでください。これにより、処理時間の短縮とコスト削減が同時に実現します。
5.3 データの鮮度(Freshness)の担保
dbtの source freshness 機能を使い、例えば「Salesforceからのデータ取り込みが12時間以上止まっている」場合にエラーを出すように設定します。数字がズレているのではなく「古い」だけという初歩的な混乱を防ぐことができます。
関連記事:広告×AIの真価を引き出す。CAPIとBigQueryで構築する「自動最適化」データアーキテクチャ
まとめ:信頼できるデータが組織を強くする
「数字がズレる」問題の解決は、単なる技術的な課題解決ではありません。部門間の不信感を拭い、全社員が同じ指標を信じてアクセルを踏める環境を作る「組織変革」そのものです。dbtを核としたデータ基盤構築により、貴社のマーケティング活動を「推測」から「確信」へと変えていきましょう。
6. 導入前に確認すべき「データマネジメント」のチェックリスト
dbtによるコード管理を成功させるには、ツールを導入する前の「情報の整理」が成否を分けます。特にB2Bマーケティングでは、商談の定義が事業部ごとに異なるケースが多いため、以下の3点を事前に定義しておく必要があります。
| チェック項目 | 確認すべき内容 | よくある失敗例 |
|---|---|---|
| 指標の計算ロジック | 「有効商談」や「失注」の判定基準は全社で統一されているか? | マーケ側は「電話がつながった数」、営業側は「案件化した数」を商談と呼び、数字が乖離する。 |
| データの主キー(PK) | 名寄せの鍵となる項目(Email、Cookie ID、会社ドメイン等)は決まっているか? | 複数のリードソースで同一人物が重複し、CV数が過大評価される。 |
| 更新頻度とコスト | データの鮮度は「リアルタイム」が必要か、それとも「1日1回」で十分か? | 不要な高頻度更新を設計し、BigQueryのクエリ課金やSaaSのAPIコストが膨れ上がる。 |
6.1 「Semantic Layer」による定義の共通化
dbtの強力な機能の一つに「Semantic Layer(セマンティックレイヤー)」があります。これは、BIツール(TableauやLooker)ごとに記述していた計算式を、dbt側で「唯一の正解」として定義し、外部ツールから参照させる仕組みです。これにより、計算ミスによる「数字のズレ」をシステム的に排除できます。
7. データ基盤の「健康診断」を自動化する品質管理手法
「dbtを導入したのに、まだ数字が合わない」という事態を防ぐには、テスト(Generic tests / Singular tests)の徹底が不可欠です。実務では以下のテストをStaging層からMart層まで多層的に配置します。
- unique(一意性): 主キーが重複していないか。
- not_null(非空): 必須項目(CV日時など)が抜けていないか。
- accepted_values(許容値): ステータスが「商談」「失注」などの想定外の値になっていないか。
これらのテストを自動化することで、上流(Salesforceの入力ミス等)で発生した異常がBIツールに反映される前に検知可能になります。より高度なデータ統合や、WebトラッキングとID連携の設計については、以下のガイドも参考にしてください。
関連記事:WebトラッキングとID連携の実践ガイド。ITP対策・LINEログインを用いたセキュアな名寄せアーキテクチャ
7.2 スモールスタートで始めるモダンデータスタック
最初からすべてのデータを統合しようとせず、まずは「最もズレて困る指標(例:広告経由の商談化数)」に絞ってdbt化することをお勧めします。基盤が整った後は、リバースETL等を用いて現場のCRMへデータを戻すことで、データ基盤への投資対効果(ROI)を早期に証明できます。
関連記事:高額MAツールは不要。BigQueryとリバースETLで構築する「行動トリガー型LINE配信」の完全アーキテクチャ
📚 関連資料
このトピックについて、より詳しく学びたい方は以下の無料資料をご参照ください:
なお、各種アプリのすべての機能を使用するには、Gemini アプリ アクティビティを有効にする必要があります。
ご相談・お問い合わせ
本記事の内容を自社の状況に当てはめたい場合や、導入・運用の設計を一緒に整理したい場合は、当社までお気軽にご相談ください。担当より折り返しご連絡いたします。