回覆評估與監測結果
評估指標
誠實性評分(Faithfulness):評估 AI 回答是否根據提取的上下文內容,避免捏造或杜撰答案。
回答相關性評分(Answer Relevance):確認回答是否與用戶問題相關,並能有效解決用戶的需求或疑問。
上下文精確度評分(Context Precision):檢查回答中引用的資料是否符合問題需求,並評估 AI 檢索到的內容中,有多少是真正對回答問題有幫助的資訊。
原因釐清
為了進一步了解系統運作,可從以下方面進行分析:
知識庫完整性:知識庫是否包含回答問題所需的資料。
RAG 檢索準確性:RAG(Retrieval-Augmented Generation)是否能精準檢索到與問題相關的資料。
LLM 回答依據性:大型語言模型(LLM)是否基於檢索到的資料進行回答,而非加入無關的內容。
Last updated