GeniAltX Documents
GeniAltX Documents
GeniAltX Documents
  • GeniAltX AI 助理平台 使用者手冊
  • 申請與登入
    • 如何申請帳號
    • 如何登入平台
  • AI 助理
    • AI 助理的功能
    • 如何建立 AI 助理
  • 如何建立知識庫
  • 如何建立 FAQ 常見問題
  • 如何使用爬蟲(爬取資料)功能
  • 回覆品質控管
  • 使用分析
  • 無幻覺的生成式 AI 回覆機制
  • 所有對話
    • 所有對話的功能
    • 串接對話平台:網站
    • 串接對話平台:LINE
  • 串接對話平台:FB Messenger
  • 內部問答
    • 內部問答的功能
  • 對話平台
    • 對話平台的功能
    • 設定對話平台
  • 組織權限
    • 組織權限的功能
    • 組織權限設定
    • 權限功能說明
  • 技術人員
    • 大型語言模型(LLM)
    • RAG 知識庫檢索系統
    • 角色指令
    • 資料庫 URL 類型介紹
    • 知識庫
    • FAQ 常見問題管理
    • 爬蟲(Beta)
    • 回覆評估與監測結果
    • 回覆精準度調教
    • 使用分析
Powered by GitBook
On this page
Edit on GitHub
  1. 技術人員

RAG 知識庫檢索系統

Previous大型語言模型(LLM)Next角色指令

Last updated 4 months ago

RAG (Retrieval-Augmented Generation,檢索增強生成) 是一種結合檢索 (Retrieval) 與生成 (Generation) 技術的生成式 AI 技術架構。它利用外部資料庫或知識庫進行檢索,將檢索結果與大型語言模型相結合,生成內容更加精準且具有上下文相關性的回應。RAG 技術的核心在於將生成式 AI 的語言能力與知識檢索能力整合,使模型在回答問題時不僅依賴內部訓練數據,還能動態地從外部資料庫中獲取最新且專業的資訊,進一步提升答案的準確性與實用性。\

為了充分發揮 RAG 的優勢,搭建高效的知識庫至關重要。建立優質知識庫的關鍵因素包含:

  1. 資料質量:知識庫中的內容必須來源可靠、準確且具有時效性。

  2. 資料結構:資料最好以結構化形式儲存,便於檢索引擎快速定位相關內容。

  3. 篩選與濾除:避免與問題無關或低質量的資訊干擾模型生成,提升回應的精準度。

高精準度的 RAG 系統

RAG 知識庫檢索系統雖然能夠快速使用向量搜尋(Vector Search)來實現,並推出基礎版本,但要進一步提升其回覆精準度卻具有挑戰性。回覆精準度對於使用者體驗至關重要,因為它直接影響到使用者對系統回應的信任度與滿意度。如果回覆精準度不足,使用者可能會對系統的答案產生懷疑,從而降低使用意願。

根據 2023 OpenAI 開發者大會資料顯示,RAG 系統若僅作單純的向量相似度搜尋(Vector Search)並且選擇正確的內嵌模型(Embedding Model),能夠達到 45%。加上 HyDE Retrieval, FT Embeddings, Chunk/Embedding Experiments 可以達到 65% 的回覆精準度。

GeniAltX RAG 除了包含 OpenAI 開發者大會中所提到的 RAG 技術以外,亦結合各種經典 NLP 演算法與獨家的檢索技術。透過內部資料集與 OpenAI RAG 的回覆正確性相比,兩者皆能達到 95% 的回覆精準度。

GeniAltX 平台提供兩種 RAG,分別是 MaiAgent RAG 與 OpenAI RAG,以下為各面向的比較表:

MaiAgent RAG
OpenAI RAG

模型支援度

支援所有模型 👍

僅支援 OpenAI 模型

環境支援度

支援雲端、地端 👍

僅支援雲端,資料需要送至 OpenAI

回覆精準度

超高 👍

超高 👍

支援檔案格式

支援所有常見格式 👍 (.doc, .docx, .xls, .xlsx, .csv, .ppt, .pptx, .pdf, .txt, .json, .jsonl, .md)

不支援 .xlsx, .csv 不支援 jsonl 不支援舊版 Office 檔案(.doc, .xlsx, .ppt)

支援文件中的圖片

有(目前為實驗性功能)👍

無

支援文件中的表格

有(目前為實驗性功能)👍

無

支援對話中的附件上傳

開發中,預計於 2024 Q4 上線

支援 👍

資料切片透明度

可視化 👍

黑盒子

Debug 難度

一般 👍

黑盒子,無法 Debug

Top K 調整

企業版客製化功能 👍

無

切換 Embedding 模型

企業版客製化功能 👍

無