RAG 知識庫檢索系統
Last updated
Last updated
RAG (Retrieval-Augmented Generation,檢索增強生成) 是一種結合檢索 (Retrieval) 與生成 (Generation) 技術的生成式 AI 技術架構。它利用外部資料庫或知識庫進行檢索,將檢索結果與大型語言模型相結合,生成內容更加精準且具有上下文相關性的回應。RAG 技術的核心在於將生成式 AI 的語言能力與知識檢索能力整合,使模型在回答問題時不僅依賴內部訓練數據,還能動態地從外部資料庫中獲取最新且專業的資訊,進一步提升答案的準確性與實用性。\
為了充分發揮 RAG 的優勢,搭建高效的知識庫至關重要。建立優質知識庫的關鍵因素包含:
資料質量:知識庫中的內容必須來源可靠、準確且具有時效性。
資料結構:資料最好以結構化形式儲存,便於檢索引擎快速定位相關內容。
篩選與濾除:避免與問題無關或低質量的資訊干擾模型生成,提升回應的精準度。
根據 2023 OpenAI 開發者大會資料顯示,RAG 系統若僅作單純的向量相似度搜尋(Vector Search)並且選擇正確的內嵌模型(Embedding Model),能夠達到 45%。加上 HyDE Retrieval, FT Embeddings, Chunk/Embedding Experiments 可以達到 65% 的回覆精準度。
GeniAltX RAG 除了包含 OpenAI 開發者大會中所提到的 RAG 技術以外,亦結合各種經典 NLP 演算法與獨家的檢索技術。透過內部資料集與 OpenAI RAG 的回覆正確性相比,兩者皆能達到 95% 的回覆精準度。
GeniAltX 平台提供兩種 RAG,分別是 MaiAgent RAG 與 OpenAI RAG,以下為各面向的比較表:
模型支援度
支援所有模型 👍
僅支援 OpenAI 模型
環境支援度
支援雲端、地端 👍
僅支援雲端,資料需要送至 OpenAI
回覆精準度
超高 👍
超高 👍
支援檔案格式
支援所有常見格式 👍 (.doc, .docx, .xls, .xlsx, .csv, .ppt, .pptx, .pdf, .txt, .json, .jsonl, .md
)
不支援 .xlsx, .csv
不支援 jsonl 不支援舊版 Office 檔案(.doc, .xlsx, .ppt
)
支援文件中的圖片
有(目前為實驗性功能)👍
無
支援文件中的表格
有(目前為實驗性功能)👍
無
支援對話中的附件上傳
開發中,預計於 2024 Q4 上線
支援 👍
資料切片透明度
可視化 👍
黑盒子
Debug 難度
一般 👍
黑盒子,無法 Debug
Top K 調整
企業版客製化功能 👍
無
切換 Embedding 模型
企業版客製化功能 👍
無