信息检索中常用的评价指标:MAP,nDCG,ERR,F-measure

2024-05-06 22:48

本文主要是介绍信息检索中常用的评价指标:MAP,nDCG,ERR,F-measure,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

知识点文本检索常用的评价指标:MAP、nDCG、ERR、F-score/F-measure以及附加的Precision、Recall、AveP、CG、DCG、IDCG、MRR、cascade models

而ROC曲线及其度量指标AUC主要用于分类和识别

一,MAP


Precision(P):

准确率(精确度)是指检索得到的文档中相关文档所占的比例,公式如下:

precision=|{relevant documents}{retrieved documents}||{retrieved documents}|

precision@10表示检索10个文档中包含相关所占的比例,即:|{retrieved documents}| = 10。

Recall(R):

召回率是指所有相关文档中被检索到的比例,公式如下:

recall=|{relevant documents}{retrieved documents}||{relevant documents}|

Average precision(AveP):

由前面可知,准确率和召回率都只能衡量检索性能的一个方面,最理想的情况肯定是准确率和召回率都比较高。当我们想提高召回率的时候,肯定会影响准确率,所以可以把准确率看做是召回率的函数,即: P=f(R) ,也就是随着召回率从0到1,准确率的变化情况。那么就可以对函数 P=f(R) R 上进行积分,可以求P的期望均值。公式如下:

AveP=10P(r)dr=k=1nP(k)Δ(k)=nk=1(P(k)×rel(k))number of relevant documents

其中 rel(k) 表示第k个文档是否相关,若相关则为1,否则为0, P(k) 表示前k个文档的准确率。 AveP 的计算方式可以简单的认为是:

AveP=1R×r=1Rrposition(r)

其中 R 表示相关文档的总个数,position(r)表示,结果列表从前往后看,第 r 个相关文档在列表中的位置。比如,有三个相关文档,位置分别为1、3、6,那么AveP=13×(11+23+36)。在编程的时候需要注意,位置和第i个相关文档,都是从1开始的,不是从0开始的。

AveP意义是在召回率从0到1逐步提高的同时,对每个R位置上的P进行相加,也即要保证准确率比较高,才能使最后的AveP比较大。

Mean average precision(MAP):

通常会用多个查询语句来衡量检索系统的性能,所以应该对多个查询语句的AveP求均值(the mean of average precision scores),即公式:

MAP=Qq=1AveP(q)Q

二,nDCG


在MAP计算公式中,文档只有相关不相关两种,而在nDCG中,文档的相关度可以分多个等级进行打分。

Cumulative Gain(CG):

表示前p个位置累计得到的效益,公式如下:

CGp=i=1preli

其中 reli 表示第i个文档的相关度等级,如:2表示非常相关,1表示相关,0表示无关,-1表示垃圾文件。

Discounted cumulative gain(DCG):

由于在 CGp 的计算中对位置信息不敏感,比如检索到了三个文档相关度依次是{3,-1,1}和{-1,1,3},显然前面的排序更优,但是它们的CG相同,所以要引入对位置信息的度量计算,既要考虑文档的相关度等级,也要考虑它所在的位置信息。假设每个位置按照从小到大的排序,它们的价值依次递减,如:可以假设第i个位置的价值是 1log2(i+1) ,那么排在第i个位置的文档所产生的效益就是 reli×1log2(i+1)=relilog2(i+1) 。公式如下:

DCGp=i=1prelilog2(i+1)=rel1+i=2prelilog2(i+1)

另一种比较常用的,用来增加相关度影响比重的DCG计算方式是:
DCGp=i=1p2reli1log2(i+1)

Ideal DCG(IDCG):

IDCG是理想情况下的DCG,即对于一个查询语句和p来说,DCG的最大值。公式如下:

IDCGp=i=1|REL|2reli1log2(i+1)

其中 |REL| 表示,文档按照相关性从大到小的顺序排序,取前p个文档组成的集合。也就是按照最优的方式对文档进行排序。

Normalize DCG(nDCG):

由于每个查询语句所能检索到的结果文档集合长度不一,p值的不同会对DCG的计算有较大的影响。所以不能对不同查询语句的DCG进行求平均,需要进行归一化处理。nDCG就是用IDCG进行归一化处理,表示当前DCG比IDCG还差多大的距离。公式如下:

nDCGp=DCGpIDCGp

这样每个查询语句的 nDCGp 就是从0到1,不同查询语句之间就可以做比较,就可以求多个查询语句的平均 nDCGp
NDCG@10、NDCG@20分别表示求p为10和20的时候的nDCG。

三,ERR


Mean reciprocal rank (MRR) :

reciprocal rank是指,第一个正确答案的排名的倒数。MRR是指多个查询语句的排名倒数的均值。公式如下:

MRR=1|Q|i=1|Q|1ranki

其中 ranki 表示第i个查询语句的第一个正确答案的排名。

Cascade Models :

之前的评分模型虽然考虑了位置自身的价值信息和位置上文档的相关度信息,但是没有考虑文档之间的相关性信息。一种考虑是,一个文档是否被用户点击和排在它前面的文档有很大的关系,比如排在前面的文档都是不相关文档,那么它被点击的概率就高,如果排它前面的文档都是非常相关的文档,那么它被点击的概率就很低。Cascade Models假设用户从排名由高到底依次查看文档,一旦文档满足了用户的需求,则停止查看后续的文档。用 Ri 表示用户只看在位置 i 上的文档后就不在需要查看其它文档的概率,显然文档的相关度越高,Ri越大。那么用户在位置 i 停止的概率公式如下:

PPr=i=1r1(1Ri)Rr

Expected reciprocal rank (ERR) :

区别RR是计算第一个相关文档的位置的倒数,ERR表示用户的需求被满足时停止的位置的倒数的期望。首先是计算用户在位置 r 停止的概率PPr,如下所示:

PPr=i=1r1(1Ri)Rr

其中 Ri 是关于文档相关度等级的函数,可以选取如下的函数:
Ri=R(gi)=2g12gmax,g{0,1,,gmax}

那么ERR的计算公式如下:
ERR=r=1nφ(r)PPr=r=1n1rPPr=r=1n1ri=1r1(1Ri)Rr

更通用一点,ERR不一定计算用户需求满足时停止的位置的倒数的期望,可以是其它基于位置的函数 φ(r) ,只要满足 φ(0)=1 ,且 φ(r)0 随着 r 。比如DCG中的 φ(r)=1log2(r+1)

四,F-score/F-measure


F-score/F-measure :

一种同时考虑准确率和召回率的指标。公式如下:

F=2×precision×recall(precision+recall)

可以看出F的取值范围从0到1。另外还有一种F的变体如下所示:
Fβ=(1+β2)×(precision×recall)(β2×precision+recall)

常用的两种设置是 F2 F0.5 ,前者中recall重要程度是precision的两倍,后者则相反,precision重要程度是recall的两倍。

这篇关于信息检索中常用的评价指标:MAP,nDCG,ERR,F-measure的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/965604

相关文章

JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法

《JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法》:本文主要介绍JavaScript中比较两个数组是否有相同元素(交集)的三种常用方法,每种方法结合实例代码给大家介绍的非常... 目录引言:为什么"相等"判断如此重要?方法1:使用some()+includes()(适合小数组)方法2

SpringBoot 获取请求参数的常用注解及用法

《SpringBoot获取请求参数的常用注解及用法》SpringBoot通过@RequestParam、@PathVariable等注解支持从HTTP请求中获取参数,涵盖查询、路径、请求体、头、C... 目录SpringBoot 提供了多种注解来方便地从 HTTP 请求中获取参数以下是主要的注解及其用法:1

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java Stream流以及常用方法操作实例

《JavaStream流以及常用方法操作实例》Stream是对Java中集合的一种增强方式,使用它可以将集合的处理过程变得更加简洁、高效和易读,:本文主要介绍JavaStream流以及常用方法... 目录一、Stream流是什么?二、stream的操作2.1、stream流创建2.2、stream的使用2.

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

MySQL字符串常用函数详解

《MySQL字符串常用函数详解》本文给大家介绍MySQL字符串常用函数,本文结合实例代码给大家介绍的非常详细,对大家学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录mysql字符串常用函数一、获取二、大小写转换三、拼接四、截取五、比较、反转、替换六、去空白、填充MySQL字符串常用函数一、

Java中Arrays类和Collections类常用方法示例详解

《Java中Arrays类和Collections类常用方法示例详解》本文总结了Java中Arrays和Collections类的常用方法,涵盖数组填充、排序、搜索、复制、列表转换等操作,帮助开发者高... 目录Arrays.fill()相关用法Arrays.toString()Arrays.sort()A

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map