GeniAltX Documents

回覆評估與監測結果

評估指標

誠實性評分（Faithfulness）：評估 AI 回答是否根據提取的上下文內容，避免捏造或杜撰答案。
回答相關性評分（Answer Relevance）：確認回答是否與用戶問題相關，並能有效解決用戶的需求或疑問。
上下文精確度評分（Context Precision）：檢查回答中引用的資料是否符合問題需求，並評估 AI 檢索到的內容中，有多少是真正對回答問題有幫助的資訊。

原因釐清

為了進一步了解系統運作，可從以下方面進行分析：

知識庫完整性：知識庫是否包含回答問題所需的資料。
RAG 檢索準確性：RAG（Retrieval-Augmented Generation）是否能精準檢索到與問題相關的資料。
LLM 回答依據性：大型語言模型（LLM）是否基於檢索到的資料進行回答，而非加入無關的內容。

Previous爬蟲（Beta）Next回覆精準度調教

Last updated 2 months ago