RAGの精度を上げる!Agentforce×ナレッジベース整備のコンテンツ設計チェックリスト
Salesforce AgentforceのRAG精度を上げるためのナレッジベース整備。コンテンツ設計のチェックリストで品質を担保する方法を整理します。
目次 クリックで開く
Agentforce×ナレッジベース整備:RAGの精度を上げるコンテンツ設計と最新事例
「Agentforceを導入したのに回答精度が上がらない」「ハルシネーション(もっともらしい嘘)が起きる」——その原因の9割は、システム設定ではなく「ナレッジ記事の書き方」と「データの質」にあります。本記事では、Data Cloudを活用した最新事例や公式のベストプラクティスを交え、RAG(検索拡張生成)の精度を劇的に高めるナレッジ設計の5原則を徹底解説します。
AgentforceのRAG精度が上がらない原因は「ナレッジの質」
Agentforce(エージェントフォース)の導入プロジェクトで頻出する悩みがあります。「Agentforce Data Library(ADL)の設定も完了し、Salesforce Knowledgeから記事もインポートした。それなのに、AIエージェントの回答精度が期待ほど上がらない」というものです。
この原因を紐解くと、多くの場合、技術的な設定エラーではなくナレッジ記事そのものの構造・文章の質(非構造化データの品質)に問題があります。
Agentforceの根幹であるRAG(Retrieval-Augmented Generation:検索拡張生成)は、ベクトル検索を用いて「ユーザーの質問と意味的に近い文章の塊(チャンク)」を取得し、それをAIへの文脈として渡す仕組みです。つまり、ナレッジ記事が「AIが検索・抽出(Retrieval)しやすい形」で書かれていなければ、システム側をどれだけ最適化しても精度は頭打ちになります。人間にとって読みやすい文章と、AIが抽出しやすい文章は全く異なるのです。
【導入事例】Agentforce×Data Cloudで実現する高度なRAG活用
ナレッジの質を高めることで、RAGはどこまで業務を自動化できるのでしょうか。ここでは、近年注目されているSalesforce Data Cloudのベクトル検索と連携した高度な実装事例を2つ紹介します。
事例1:M&A仲介における「類似度検索」の自動化
あるM&A仲介会社では、買い手と売り手のマッチング業務にAgentforceとRAGを導入しました。従来は担当者の属人的な記憶や限られた検索に依存していましたが、Data Cloudのベクトル検索を活用しプロセスを革新しました。
- CRM内の過去の「面談メモ」や、外部から取得した企業情報をData Cloudに集約。
- AIが売り手企業の情報を要約し、買い手企業の「買収ニーズ(非構造化データ)」とベクトル空間上で類似度検索(マッチング)を実行。
- 類似度スコア付きの候補リストを自動生成することで、ロングリスト作成の労働集約的な業務を大幅に削減しました。
事例2:不動産・小売業における「横断的な顧客対応」
カスタマーサポート領域でも、Data CloudにつながることでAgentforceが見える世界は一気に広がります。ある不動産管理会社では、入居者からのトラブル対応に活用しています。
- 過去のWeb行動ログ、メールの反応、契約情報、トラブル解決のナレッジ記事を統合。
- 「水漏れが起きた」という問い合わせに対し、Agentforceが契約内容(保険の有無など)と過去の対応ナレッジを瞬時に参照。
- 会話の流れの中で、修理手順の提示だけでなく、部品手配や工事業者への連携までを自律的に進行。顧客満足度と解決スピードの劇的な向上を実現しています。
【超重要】AIが読み込む「チャンキング(分割)」の仕組み
上記のような高度な事例を実現する上で避けて通れないのが、データを取り込む際の「チャンキング(Chunking)」の理解です。
Agentforceにナレッジ記事を取り込む際、長い文章はそのままインデックスされるわけではなく、一定の文字数ごとに「チャンク(小さなブロック)」に分割されてベクトル化されます。この仕様を理解していないと、「記事の後半に書いてある重要な例外条件が、AIの回答から抜け落ちる」といった現象が起きます。
・「主語」を省略しない(チャンクが分割された際、何の話をしているかAIが文脈を見失うため)。
・「代名詞(これ、それ)」を使わず、固有名詞(製品名・機能名)を繰り返す。
・1つの段落に複数のトピックを詰め込まず、見出しで細かく区切る。
ADLの「クイックスタート」と、Data 360の「高度なRAG」の使い分け
AgentforceでRAGを設定する際、Salesforce公式ガイドでは大きく2つのアプローチが提示されています。ナレッジの管理工数と求めるカスタマイズ性によって選択します。
| 比較軸 | ① Agentforce Data Library (ADL) | ② Advanced Data 360 (Data Cloud個別設定) |
|---|---|---|
| アプローチ | クイックスタート | 上級者向け(ビルダーツールによる高度な設定) |
| セットアップ | ◎ 数分で完了、RAGコンポーネントを自動生成 | △ 検索インデックス・レトリーバーを個別設定 |
| データソース | HTML、PDF、Knowledgeオブジェクト等 | 構造化・非構造化データを幅広く柔軟に対応 |
| カスタマイズ性 | △ 標準設定のみ | ◎ 特定のユースケースに合わせエンドツーエンドで制御 |
実務上もっとも損失が少ないアプローチは、まずADLでスモールスタートし、Agentforceに回答の根拠を学ばせた後、RAG品質スコアを確認しながらData 360の個別設定(特定のメタデータによる絞り込み等)へ移行するかを判断することです。
AgentforceのRAG精度を劇的に上げるナレッジの5原則
AIのベクトル検索に的確に引っかかり、正確な回答の根拠となるナレッジ記事には「型」があります。以下の5原則を徹底してください。
原則1:1記事1答(1つの質問に1つの記事)
「設定方法と料金と注意点」のように複数の回答を1記事に詰め込むと、チャンク分割時に文脈が混在します。「作成手順」「ライセンス料金」のように別記事に分けることで、AIが的確なチャンクを引き当てやすくなります。
原則2:見出し(H2/H3)で回答の骨格を明示する
RAGは多くの場合、見出しや段落構造を参照します。「手順」「条件」「注意点」といった機能的な言葉を見出しに含めることで、「このチャンクは何の情報か」がAIに伝わります。
原則3:具体的な名称・数値・条件を必ず含める
「簡単に設定できます」のような曖昧な記述はセマンティック検索では引っかかりません。画面名称、入力項目名、操作ステップ数などの「情報密度」を上げてください。
原則4:条件分岐を先頭に明示する(「〜の場合は〜」)
実務の質問には条件が伴います。「Sandbox環境の場合は〜」「Enterprise版の場合は〜」のように条件を先頭に出した構造で書くと、ユーザーの質問の文脈とのベクトル距離が縮まります。
原則5:更新日と有効バージョンを冒頭に明記する
古い情報の混入はハルシネーションの最大の原因です。「この情報はSalesforce Winter ’25リリース時点のものです」と明記し、AIが情報の鮮度を判別できるようにします。
📋 ナレッジ記事公開前チェックリスト(RAG精度最適化)
- 記事のテーマが1つの質問・1つの回答に絞られているか
- 主語や固有名詞を省略せず、代名詞(それ・これ)の使用を控えているか
- H2/H3見出しに「手順」「条件」「料金」等の機能語が含まれているか
- 条件分岐が「〜の場合は〜」の形式で明示されているか
- 記事冒頭に更新日と適用バージョンが記載されているか
- 1記事が長すぎないか(目安:1,500字以内、長い場合は分割)
【ベストプラクティス】アクション設定と非構造化データの扱い方
プロンプト・アクション設計の工夫
Salesforceの公式ベストプラクティスによると、エージェントのアクション(例:「ナレッジを使用して質問に回答する」)を定義する際、検索クエリに前提条件を組み込むようプロンプトで指示することが精度向上の鍵となります。
たとえば、「情報を取得する前に、必ずデバイスの種類(iOSまたはAndroid)をユーザーに確認し、その情報を検索クエリに含めてください」と指示することで、的外れな回答を事前に防ぐことができます。
画像や表(非構造化データ)の最適化
PDFマニュアルのスクリーンショット画像や、複雑な料金表をそのまま貼り付けてもAIは正しく内容を抽出できません。
- 画像の場合:必ず代替テキスト(Alt属性)やキャプションとして、「画像内のテキストや意味」を文章で書き起こしてください。
- 表(テーブル)の場合:セル結合を含む複雑な表はAIが誤認しやすいため、極力シンプルな表にするか、Markdown形式(またはプレーンテキストの箇条書き)に変換して記載することを強く推奨します。
RAG品質スコアを使った継続的な改善サイクル
ナレッジは一度作って終わりではありません。Salesforceが提供するRAG品質のダッシュボードを活用し、定量的なスコアを起点にして改善サイクルを回します。
| スコア指標 | 意味 | スコアが低いときのナレッジ対策 |
|---|---|---|
| Context Precision | 取得したチャンクが質問に対して的確かどうか | データカテゴリ等のメタデータを見直し、無関係な記事の混入を防ぐ。「1記事1答」の原則を再徹底する。 |
| Faithfulness | AIの回答がナレッジの内容に忠実かどうか | 記事の文章が曖昧でないか確認。条件分岐を明示し、固有名詞の省略(代名詞化)をやめる。 |
| Answer Relevance | 回答がユーザーの質問に対して関連性があるかどうか | 「どのような質問に答える記事か」を冒頭のリード文で明示する。 |
まとめ:Agentforceの賢さは「データの質」に比例する
Agentforceのパフォーマンスを最大化するためには、高性能なAIモデルと同じくらい、それに食わせる「データの質」が重要です。AIが自律的に計画し、推論し、行動できるエージェントとして活躍するかどうかは、私たちが整備するナレッジベースの構造にかかっています。まずはADLでのスモールスタートから始め、本記事のチェックリストを活用して質の高いナレッジ構築を進めてください。
Agentforce導入・Data Cloud連携のご相談
RAG精度の改善、Data Cloudのベクトル検索を活用した高度なAI構築、ナレッジベース設計のコンサルティングを承ります。まずは現状の課題をお聞かせください。