【漫画で分かるDX】第20回:探せない知識は、ないのと同じ。社内ドキュメント検索とRAGの現実解
『漫画で分かるDX』第20回。—
あとがき ― 社内検索とRAGの現実解
生成AIを使った社内ナレッジ検索(いわゆるRAG)は、モデルより前に**取り込むドキュメントの母集団**と**更新・権限**と**引用表示**が本丸です。 佐藤さんと田中くんによる、分かりやすいIT・AI解説シリーズ。
目次 クリックで開く
探せない知識は、ないのと同じ。社内ドキュメント検索とRAGの現実解
社内Wikiにはページが増え続け、検索窓に打ち込んだ単語は、いつも古い議事録か退職者の日報に引っ張られる。正しそうな見出しの下に、三年前の注意書きが残っている。更新日が新しいページほど、実はコピペの残骸であることもある。
田中誠は「きっとどこかにあるはず」の手がかりを、五つ目のタブで探している。チャットの過去ログまで遡ると、結局「口頭で決めた」行間だけが残る。
問題は量ではない。入口だ。入口が一つに揃わない限り、賢い仕組みも人も同じ場所を探し回る。
佐藤修は検索結果を閉じ、静かに言った。「まず索引の母集団を決めよう。全部を賢くする前に、公式の箱を一つ作る」——黒坂剛が遠くで笑う。「全部入れた方が賢いでしょ? 狭いと使えないですよ」
登場人物紹介
【本話の登場】田中・佐藤・岸本・黒坂(水野は出ません/社内検索と索引範囲が主題)。
田中 誠(29):情シス兼ナレッジ担当気味。タブを増やすほど答えが遠ざかる日々。
佐藤 修(39):シニアDXアーキテクト。索引の母集団・権限・引用表示から社内検索とRAGを設計する。
岸本 麻衣(41):経理主任・部門担当。公式文書の取り扱いとコンプラ観点から、索引に載せる範囲に厳しい。
黒坂 剛(62):競合営業。白混ロング。「全部インデックスが正義」型。
「手順書、版が三つあってどれが正か分からない……。チャットの過去まで探すのが日課です」
新人が横から恐る恐る聞く。「先輩、これどれ見ればいいですか?」田中は笑って「それが分かったら苦労しない」と答え、自分の情けなさに少し後悔した。

岸本が言う。「公式じゃないものまで載せたら、答えがノイズになる。コンプラ的にもまずい」
佐藤が頷く。「社内検索の現実解は、取り込む範囲と更新周期を決め、権限を守ることから入る。RAGは魔法の検索窓じゃなく、索引の運用だ」
黒坂が肩をすくめる。「狭いと使えないですよ」
「狭いほど、仕事に効くこともある」佐藤が言った。「まずは『このフォルダが正』を決める。広げるのはあとでいい」
「回答には必ず引用元を付ける。出典が無い文は採用しない——運用ルールにする」
田中は、ハルシネーションという難しい言葉を使わずに説明できると思った。「出典のない答えは、採用しない」。それで十分怖いし、十分やさしい。
「昨日の手順、質問が半分に減りました……。検索して引用付きで返ってくるので」
新人が画面のリンクを開き、「このPDFが公式?」と聞く。田中は「索引に入ってる版が公式」と答えた。言葉にすると、自分たちのルールが初めて形を持つ。
佐藤が言う。「次は『廃止予定』の札を自動で付ける運用を入れよう。索引のゴミは、検索のゴミになる」
整理は終わらない。だが公式の入口が一つに寄せられたことで、議論の起点がそろい始めた。「どれが正?」の前に、「どこを見る?」が同じになる。
「RAGの本丸はモデル選びより、索引と運用だ」佐藤が言う。
田中は月一の棚卸しをカレンダーに入れた。索引の健康診断は、誕生日くらい忘れない方がいい。
ここから先は、本文のストーリーとは切り離した解説です。
あとがき ― 仕事に落とすと
あとがき ― 社内検索とRAGの現実解
生成AIを使った社内ナレッジ検索(いわゆるRAG)は、モデルより前に**取り込むドキュメントの母集団**と**更新・権限**と**引用表示**が本丸です。何でも索引に入れると、正しそうな誤答が増え、現場の信頼が先に壊れます。
ポイント
公式・ドラフト・廃止の三段: どれを索引に入れるか、どれを表記で隔離するかを最初に決める。
再インデックス周期の固定: ドキュメントの寿命と同じくらい、索引の寿命も管理する。
出典なし回答を使わない運用: 引用が付かない文は採用しない——をルールにすると、説明責任が続く。
索引設計からポータル統合まで、Aurant Technologiesは伴走します。