回覆評估與監測結果

評估指標

  1. 誠實性評分(Faithfulness):評估 AI 回答是否根據提取的上下文內容,避免捏造或杜撰答案。

  2. 回答相關性評分(Answer Relevance):確認回答是否與用戶問題相關,並能有效解決用戶的需求或疑問。

  3. 上下文精確度評分(Context Precision):檢查回答中引用的資料是否符合問題需求,並評估 AI 檢索到的內容中,有多少是真正對回答問題有幫助的資訊。

原因釐清

為了進一步了解系統運作,可從以下方面進行分析:

  1. 知識庫完整性:知識庫是否包含回答問題所需的資料。

  2. RAG 檢索準確性:RAG(Retrieval-Augmented Generation)是否能精準檢索到與問題相關的資料。

  3. LLM 回答依據性:大型語言模型(LLM)是否基於檢索到的資料進行回答,而非加入無關的內容。

Last updated