医療DWHの星型設計徹底解説:患者・受診・診療行為・検査データモデルで実現する医療DX

医療DWHの星型設計で患者・受診・診療行為・検査データをどうモデル化するか。具体的なデータモデル例から、医療DXを加速するデータ活用戦略と実践的課題解決策を解説します。

この記事をシェア:
目次 クリックで開く

医療DWHの星型設計徹底解説:患者・受診・診療行為・検査データモデルで実現する医療DX

100件超のBI研修と50件超のCRM/データ基盤導入から導き出した、医療データの「サイロ化」を打破する究極のアーキテクチャ。現場の落とし穴を回避し、経営と臨床の質を直結させる設計指針を公開します。

はじめに:なぜ医療機関のデータ活用は「星型設計」でなければならないのか

医療現場において「データはあるが、活用できていない」という声は、私がコンサルティングに入らせていただくほぼ全ての病院で共通する悩みです。電子カルテ、レセコン、画像診断、検査システム……。各部門で最適化されたSaaSやパッケージが導入された結果、データはバラバラに分断(サイロ化)され、経営層が「疾患別の利益率」を見ようとしたり、臨床医が「特定薬剤の投与量と検査値の相関」を分析しようとしても、SQLの地獄のような結合(JOIN)作業に阻まれるのが実態です。

この問題を解決する唯一の処方箋が、「星型設計(スタースキーマ)」による医療DWH(データウェアハウス)の再構築です。正規化された業務データベースとは異なり、分析の高速化と直感性を追求したこの設計手法こそが、医療DXの心臓部となります。本稿では、実務で数々の失敗と成功を見てきた立場から、教科書通りではない「勝てるデータモデル」を解説します。

コンサルの眼: 多くのエンジニアが犯す最大のミスは、電子カルテのデータ構造をそのままDWHに写そうとすることです。電子カルテは「入力」のための最適化であり、DWHは「出力」のための最適化。この目的の分離ができていないプロジェクトは、例外なくパフォーマンス不足で頓挫します。

1. 医療DWHの基礎と星型設計の構造

ファクトとディメンションの明確な分離

星型設計は、中央に「事実」を記録するファクトテーブルを置き、その周囲に「属性」を示すディメンションテーブルを配置します。医療データにおいては、以下の定義が標準となります。

  • ファクトテーブル: 受診、診療行為(点数/費用)、検査結果値、処方量、入院日数など。時系列で蓄積され、計算(SUMやAVG)の対象となるデータ。
  • ディメンションテーブル: 患者属性、医師名、診療科、ICD-10(疾患コード)、日付、時間、施設など。分析の「切り口(軸)」となるデータ。
設計要素 役割 医療現場での具体例
ファクト 事象の数値的記録 診療行為点数、検査値、待ち時間、利益額
ディメンション 文脈・属性の定義 患者の年齢層、主治医の専門、地域、年度
メリット 分析の高速化 数千万件の検査データから特定疾患のみを数秒で抽出可能

この構造を採用することで、現場のスタッフがTableauやPower BIなどのBIツールを使って自らデータを探索する際、「どのテーブルと結合すればいいか分からない」という迷いを一掃できます。関連リンクとして、【図解】SFA・CRM・MA・Webの違いを解説。高額ツールに依存しない『データ連携の全体設計図』も参照してください。データ連携の思想は、ヘルスケアでもバックオフィスでも共通です。

2. 【実践】患者ディメンションの設計と「名寄せ」の罠

主要項目とデータモデリング

患者ディメンション(Dim_Patient)は、分析の基点となる最重要テーブルです。単に電子カルテの患者マスタをコピーするのではなく、分析に必要な「導出属性」を持たせることが肝要です。

  • 患者ID(サロゲートキー): システム間のID重複を避けるためのDWH専用キー。
  • 属性情報: 生年月日、性別、住所(市区町村レベル)、死亡フラグ。
  • 【+α】分析用属性: 初診日からの経過日数、最終受診日、重症度カテゴリなど。
実務の落とし穴: 医療機関における「名寄せ」は、CRM導入以上にシビアです。漢字の旧字体・新字体、結婚による姓の変更、電話番号のハイフン有無。これらを放置すると、一人の患者が「別人」として集計され、コホート分析が崩壊します。BigQuery等を用いたクレンジング処理を、DWH投入前のELT工程で必ず組み込むべきです。

匿名化・仮名化の実装指針

医療データは「要配慮個人情報」の塊です。分析用DWHには、直接識別子(氏名、詳細な住所、電話番号)は入れず、ハッシュ化した仮名IDを使用するのが鉄則です。
【出典URL:厚生労働省:医療情報システムの安全管理に関するガイドライン

3. 受診・診療行為・検査のデータモデル設計

受診ファクト(Fact_Encounter)

「1受診(来院から帰宅まで)」を1レコードとする粒度です。ここでは、「待ち時間」「滞在時間」「初再診区分」をメジャーとして持ちます。これは病院経営における「稼働率」や「効率性」を測るKPIの源泉となります。

診療行為ファクト(Fact_Procedures)

粒度は「オーダー明細単位」です。DPC(診断群分類別包括評価)対象病院の場合、ここに含まれるDPCコードと点数が、収益分析の鍵を握ります。

項目カテゴリ 物理名例 解説
外部キー patient_key INT Dim_Patientへの結合用
外部キー date_key INT Dim_Dateへの結合用
メジャー procedure_points DECIMAL 診療行為の点数
メジャー drug_dosage DECIMAL 薬剤の投与量

検査ファクト(Fact_LabResults)

検査データは、数値データとテキストデータ(所見)が混在する難所です。
数値データについては、必ず「基準値上限・下限」を同一レコード内に持たせる設計にしてください。
【出典URL:一般社団法人 日本医療情報学会:J-MIX(標準的検体検査データ名称)

コンサルの眼: 検査データの「単位」を無視して設計すると、後で悲劇が起きます。mg/dLとg/Lが混在したまま平均値を算出してしまうようなミスは、データ基盤の信頼性を致命的に損ないます。マスタ側で単位変換係数を持たせ、DWH側で標準化単位に統一した「計算済みメジャー」を用意しておくのがプロの仕事です。

4. 推奨ツールとコスト感

医療DWHを構築する際、オンプレミスのレガシーなDBを選択するのはもはや時代遅れです。拡張性とセキュリティ、そして何より計算能力を考慮すると、クラウドネイティブな構成一択となります。

1. Google BigQuery

医療DXにおいて最も採用されているデータウェアハウスです。

  • 特徴: サーバーレスで運用負荷が極めて低い。数ペタバイトのクエリも数秒で完結。
  • コスト: ストレージ:$0.02/GB、クエリ:$5/TB(無料枠あり)。
  • 公式サイトURL: https://cloud.google.com/bigquery

当社のアーキテクチャ事例でも、高額MAツールは不要。BigQueryとリバースETLで構築するアーキテクチャとして紹介しています。

2. Snowflake

マルチクラウド対応のデータクラウド。

  • 特徴: データの共有機能(Data Sharing)が強力で、共同研究やグループ病院間での連携に最適。
  • コスト: コンピューティング費用:$2.00/クレジット〜。
  • 公式サイトURL: https://www.snowflake.com/ja/

3. trocco(ETLツール)

医療機関内の閉域網データをクラウドへ転送するための国内SaaS。

  • 特徴: GUIベースで設定可能。日本の商習慣やデータ構造に強く、サポートが手厚い。
  • コスト: 月額10万円〜。
  • 公式サイトURL: https://trocco.io/

5. 導入事例・成功シナリオ:特定機能病院Bの変革

課題:経営分析の遅延と臨床研究の限界

特定機能病院Bでは、月次の経営会議資料を作成するのに、医事課のスタッフが毎月30時間をかけてExcel集計を行っていました。また、医師が研究のためにデータを必要とする際も、情報システム部門に依頼してからデータが届くまで1ヶ月を要していました。

解決策:BigQueryによる星型DWHの構築

電子カルテおよび医事会計システムのデータをtrocco経由でBigQueryへ統合。本稿で解説した「星型設計」に基づき、患者・受診・診療行為・検査の4大データモデルを構築しました。

成果:

  • 経営可視化: 会議資料の自動更新により、医事課の残業代を年間200万円削減。
  • 臨床への貢献: 医師がLookerを利用し、自ら「特定術式後の合併症発生率」をリアルタイムに分析可能になった。
  • コスト最適化: 不要な検査や過剰投薬のパターンを可視化し、薬剤費の3%削減に成功。

【出典URL:Google Cloud Blog: How hospitals use BigQuery

まとめ:データモデルが医療の質を決定する

医療DXとは、単に電子カルテを入れることではありません。蓄積された膨大なデータを「知恵」に変える仕組みを、組織に埋め込むことです。そのためには、技術的に正しいデータモデル、すなわち**「星型設計」**という強固な土台が不可欠です。

もし貴院が、高額なパッケージを導入したにもかかわらず、「見たいデータが見られない」状況にあるなら、それはツールのせいではなく、データアーキテクチャの不在が原因かもしれません。私たちは、単なるシステムの導入ではなく、現場が使いこなせるデータ基盤の設計から、BI研修による文化の定着までを伴走支援します。

最後に: 基盤構築後は運用が鍵です。SaaS増えすぎ問題と退職者のアカウント削除漏れを防ぐ。Entra ID・Okta・ジョーシスを活用した自動化アーキテクチャなどを参考に、DWHへのアクセス権限管理も自動化することを強く推奨します。
近藤
近藤 義仁 / Aurant Technologies

100件以上のBI研修、50件以上のCRM/データ基盤導入実績。
医療機関から急成長SaaSまで、データの力で経営判断を「勘」から「科学」へ変える専門家。
「使われないシステム」を撲滅し、実務に根ざしたアーキテクチャ設計を信条とする。

実務で避けて通れない「標準化規格」とセキュリティの補足

星型設計を実装する際、現場で必ず突き当たるのが「電子カルテごとのデータ形式の違い」です。これらを共通言語化するための規格や、クラウド利用時の法規制準拠について、設計前に確認すべきポイントをまとめました。

医療データ標準化のためのチェックリスト

ファクトテーブルにデータを流し込む前に、以下の標準コードセットがマスタ(ディメンション)に紐付いているか確認してください。これらが欠落していると、他施設との比較や外部データ連携が困難になります。

  • 検体検査結果: JLAC10コード(日本臨床検査標準コード)への変換
  • 処方・注射: HOTコード(医薬品共通商品コード)の保持
  • 病名: ICD-10(国際疾患分類)および標準病名マスターの紐付け
  • 外部連携: SS-MIX2(厚生労働省標準規格)ストレージからの抽出経路確保

クラウドDWH採用時の「3省2ガイドライン」対応

BigQueryなどのパブリッククラウドを利用する場合、医療機関には「3省2ガイドライン」への準拠が求められます。主要ベンダーは責任共有モデルに基づいたホワイトペーパーを公開しています。設計書作成時のエビデンスとして活用してください。

コンサルの眼: 医療DXの現場では「SS-MIX2からデータを出せば星型設計は不要」と誤解されることがありますが、SS-MIX2はあくまで「交換用」の規約であり、BIツールでの「分析用」には不向きな構造です。SS-MIX2をステージング層(Staging)とし、本稿で解説したスタースキーマをデータマート層(Mart)に構築するのが、最もメンテナンス性の高い構成です。

また、院内の基幹システム(電子カルテ等)とクラウドDWHを連携させる際は、ネットワーク分離の壁も考慮しなければなりません。具体的なネットワークアーキテクチャについては、SaaSコストとオンプレ負債を断つ。バックオフィス&インフラの「標的」と現実的剥がし方で解説しているハイブリッド環境の考え方が参考になります。

医療データの価値を最大化する設計、ご相談ください

貴院のデータサイロを解消し、経営と臨床を直結させるモダンデータスタックの構築を支援します。

無料相談を予約する

ご相談・お問い合わせ

本記事の内容を自社の状況に当てはめたい場合や、導入・運用の設計を一緒に整理したい場合は、当社までお気軽にご相談ください。担当より折り返しご連絡いたします。

お問い合わせフォームへ

【補論】医療DWH 標準化規格の対応マトリクス

本文の星型設計を、業界標準規格に紐付けて整理します。これらに沿うことで他施設・研究機関とのデータ共有が容易になります。

規格 用途 対応モデル
HL7 FHIR 電子カルテ・HIS連携 Patient/Observation/Encounter
DPC 診療報酬・病名分類 DPC→傷病名→診療行為
レセプト電算 医科・歯科レセ 診療行為Fact
SS-MIX2 標準化ストレージ FHIRへの変換ハブ
OMOP CDM 国際リアルワールド研究 医療研究目的

医療データ セキュリティ 必須対応

  • 3省2ガイドライン準拠(医療情報安全管理)
  • 仮名化・匿名化(k-匿名化、差分プライバシー)
  • 院内DWH研究DWHを物理分離
  • アクセスログを全クエリ単位で長期保管
  • 個人特定可能性テスト(再識別リスク評価)

星型設計のFact/Dimension追加例

テーブル 主項目
Fact_Encounter(受診) 患者ID/受診日/診療科ID/医師ID
Fact_Procedure(診療行為) レセプトコード/点数
Fact_Lab(検査結果) 検査項目/値/基準範囲
Dim_Patient 年齢・性別・地域(仮名化)
Dim_Date 曜日・季節・休祝日
Dim_Department 診療科コード・標榜・収益区分
Dim_Doctor 勤続年数・専門領域・常勤区分

医療経営の標準KPI

  • 平均在院日数(DPC効率指数)
  • 診療単価(外来/入院別)
  • 診療科別収益/粗利
  • 再診率/紹介率/逆紹介率
  • 医師1名あたり患者数/時間外労働

推奨技術スタック

推奨
DWH BigQuery(医療向けプライバシーオプション)
ETL SS-MIX2 → FHIR変換 + dbt
BI Looker / Tableau(医療向けテンプレ)
仮名化 DLP API + Tokenization

FAQ(本文への補足)

Q. HIS連携で最も難しいのは?
A. 「マスタコード変換とリアルタイム同期」。SS-MIX2をハブにすれば多くのHISと接続可能。詳細は SFA・CRM・MA・Webピラー
Q. 研究利用への展開は?
A. 「OMOP CDMへの変換層を別途構築」でリアルワールドデータ研究へ展開可能。
Q. 中小病院での現実解は?
A. 「DPC分析→診療科別収益→経営改善」からスタート。フル構築は段階的に。

関連記事

  • 【オンプレDB→BigQuery】(ID 476)
  • 【会計SaaS DWH連携】(ID 600)
  • 【Looker活用】(ID 551)
  • 【Snowflake×Reverse ETL】(ID 519)

※ 2026年5月時点。本文の補完を目的とした追記です。

データ分析・BI

Looker Studio・Tableau・BigQueryを活用したBIダッシュボード構築から、データ基盤整備・KPI設計まで対応。経営判断をデータで支援します。

AT
aurant technologies 編集

上場企業からスタートアップまで、数多くのデータ分析基盤構築・AI導入プロジェクトを主導。単なる技術提供にとどまらず、MA/CRM(Salesforce, Hubspot, kintone, LINE)導入によるマーケティング最適化やバックオフィス業務の自動化など、常に「事業数値(売上・利益)」に直結する改善実績多数。

この記事が役に立ったらシェア: