[轉貼]NDCG評量指標,滿清楚的解說文章

2014年7月23日 星期三

衡量指標編輯

衡量搜索引擎質量指標(DCG -- Discounted Cumulative Gain)
DCG的英文全稱是Discounted cumulative gain,它是一個衡量搜索引擎算法的指標。
搜索引擎一般採用PI(per item)的方式進行評測,簡單地說就是逐條對搜索結果進行分等級的打分。假設我們現在在Google上搜索一個詞,然後得到5個結果。我們對這些結果進行3個等級的區分:Good(好)、Fair(一般)、Bad(差),然後賦予他們分值分別為3、2、1,假定通過逐條打分後,得到這5個結果的分值分別為3、2 、1 、3、 2。
接下來我們來看看是怎麼計算DCG的
使用DCG這個統計方法有兩個前提:
1.在搜索結果頁面,越相關的結果排在越前面越好
2.在PI標註時,等級高的結果比等級低的結果好,即Good要比Fair好、Fair要比Bad好。
DCG這個概念是從Cumulative Gain這個概念發展起來的