信息论基础:生日问题

2024-04-07 10:36
文章标签 基础 问题 信息论 生日

本文主要是介绍信息论基础:生日问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

生日问题

我的小学同班同学小琦,和我是同一天生日。每次聚会,我俩同时在场时,我们都会向其他人提起这一点。我们觉得这是很幸运的。

这个概率大吗?要回答这样的问题,需要把几个问题区分清楚。

  • 问题1:对于特定的某个同学,他与我生日相同的概率是多少?这个概率是1/365,并不大。
  • 问题2:某班有𝑆个学生,有人与我生日相同的概率是多少?这个概率大约是(𝑆-1)/365,并不小。
  • 问题3:某班有𝑆个学生,至少两个学生生日相同(月和日相同)的概率是多少?

问题3是概率中的生日问题(Birthday Problem)。首先,计算没有人生日相同的概率。为了表达式的含义更明确,用𝐴表示一年的天数365。所有人生日不同的概率为:
P = A ( A − 1 ) ( A − 1 ) . . . ( A − S + 1 ) A S . P = \frac {A(A-1)(A-1) ... (A-S+1)} {A^S}. P=ASA(A1)(A1)...(AS+1).

至少有两人生日相同的概率为1−𝑃。下图绘制了至少两人生日相同的概率(纵坐标)与人数(横坐标)的关系。如果班里有23人,至少有两人生日相同的概率>50%;如果有57人,概率>99%。

如果要和人打赌一个班有没有相同生日的人,只要人数不少于23人,就可以赌有,获胜的概率超过一半。

还有另一个问题。令𝑋表示班里生日相同的对数。𝑋的期望是多少?
E ( X ) = S ( S − 1 ) 2 1 A . E(X) = \frac {S(S-1)} 2 \frac 1 A. E(X)=2S(S1)A1.

生物特征识别也有生日问题。在生物特征系统中,一个人被编码为其的生物特征,例如人像、指纹、虹膜。如果生物特征识别算法认为两个人的生物特征重了,就是发生了错误匹配(False Match)。任意一对生物特征的错误匹配概率(FMR,False Match Rate),类似任意两个人的生日相同概率(1/A)。只要有两个人的生物特征重了,就叫做发生冲突。假设整个系统一共有𝑆人,识别算法的FMR需要多小,才能使冲突概率约为1/2?

不冲突的概率为:
( 1 − F M R ) S ( S − 1 ) 2 = 0.5 (1-FMR)^{\frac {S(S-1)} 2} = 0.5 (1FMR)2S(S1)=0.5
得出:
F M R = 1 − 0. 5 2 S ( S − 1 ) FMR = 1-0.5^ {\frac 2 {S(S-1)}} FMR=10.5S(S1)2

下图绘制了FMR和𝑆的关系,由于两个数字的范围都太大,用对数坐标。从中看出,有1亿人时,冲突概率1/2对应的FMR为 1 0 − 16 10^{-16} 1016

生物特征冲突在大规模身份识别系统中容易出现。因此,大规模身份识别系统对于FMR要求非常高。例如,印度曾经没有全民的身份证,有人根本没有身份,而有人有多重身份,这会带来很多社会问题。后来印度实施了Aadhaar项目,要给每个印度人一个唯一的身份证。印度有14亿多人口,为了保证尽可能低的FMR(因此尽可能低的冲突概率),采集了每个人的人像、十指指纹和一对虹膜。

每当有人来申请身份证,要在所有已经发证的数据库中,进行生物特征查重。当所有人的身份证都办完的时候,14亿人之间就全部做过比对了。一共是 2 × 1 0 18 2 \times 10^{18} 2×1018,200亿亿次比对。这就要求FMR要非常低。

为了降低FMR,Aadhaar项目融合了三种生物特征。实验表明,指纹加虹膜的效果特别有效。在一个大规模的测试库上,融合后的错误率显著下降。

参考文献

  1. A.K. Jain. http://biometrics.cse.msu.edu/Presentations/MBZUAI_Sept_1_2020.pdf

  2. Daugman, John. “Collision avoidance on national and global scales: Understanding and using big biometric entropy.” TechRxiv (2021).

这篇关于信息论基础:生日问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/882364

相关文章

MySQL版本问题导致项目无法启动问题的解决方案

《MySQL版本问题导致项目无法启动问题的解决方案》本文记录了一次因MySQL版本不一致导致项目启动失败的经历,详细解析了连接错误的原因,并提供了两种解决方案:调整连接字符串禁用SSL或统一MySQL... 目录本地项目启动报错报错原因:解决方案第一个:第二种:容器启动mysql的坑两种修改时区的方法:本地

springboot加载不到nacos配置中心的配置问题处理

《springboot加载不到nacos配置中心的配置问题处理》:本文主要介绍springboot加载不到nacos配置中心的配置问题处理,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录springboot加载不到nacos配置中心的配置两种可能Spring Boot 版本Nacos

安装centos8设置基础软件仓库时出错的解决方案

《安装centos8设置基础软件仓库时出错的解决方案》:本文主要介绍安装centos8设置基础软件仓库时出错的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录安装Centos8设置基础软件仓库时出错版本 8版本 8.2.200android4版本 javas

Java中JSON格式反序列化为Map且保证存取顺序一致的问题

《Java中JSON格式反序列化为Map且保证存取顺序一致的问题》:本文主要介绍Java中JSON格式反序列化为Map且保证存取顺序一致的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未... 目录背景问题解决方法总结背景做项目涉及两个微服务之间传数据时,需要提供方将Map类型的数据序列化为co

如何解决Druid线程池Cause:java.sql.SQLRecoverableException:IO错误:Socket read timed out的问题

《如何解决Druid线程池Cause:java.sql.SQLRecoverableException:IO错误:Socketreadtimedout的问题》:本文主要介绍解决Druid线程... 目录异常信息触发场景找到版本发布更新的说明从版本更新信息可以看到该默认逻辑已经去除总结异常信息触发场景复

VS配置好Qt环境之后但无法打开ui界面的问题解决

《VS配置好Qt环境之后但无法打开ui界面的问题解决》本文主要介绍了VS配置好Qt环境之后但无法打开ui界面的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要... 目UKeLvb录找到Qt安装目录中designer.UKeLvBexe的路径找到vs中的解决方案资源

Linux基础命令@grep、wc、管道符的使用详解

《Linux基础命令@grep、wc、管道符的使用详解》:本文主要介绍Linux基础命令@grep、wc、管道符的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录grep概念语法作用演示一演示二演示三,带选项 -nwc概念语法作用wc,不带选项-c,统计字节数-

MySQL启动报错:InnoDB表空间丢失问题及解决方法

《MySQL启动报错:InnoDB表空间丢失问题及解决方法》在启动MySQL时,遇到了InnoDB:Tablespace5975wasnotfound,该错误表明MySQL在启动过程中无法找到指定的s... 目录mysql 启动报错:InnoDB 表空间丢失问题及解决方法错误分析解决方案1. 启用 inno

Java使用MethodHandle来替代反射,提高性能问题

《Java使用MethodHandle来替代反射,提高性能问题》:本文主要介绍Java使用MethodHandle来替代反射,提高性能问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑... 目录一、认识MethodHandle1、简介2、使用方式3、与反射的区别二、示例1、基本使用2、(重要)

电脑蓝牙连不上怎么办? 5 招教你轻松修复Mac蓝牙连接问题的技巧

《电脑蓝牙连不上怎么办?5招教你轻松修复Mac蓝牙连接问题的技巧》蓝牙连接问题是一些Mac用户经常遇到的常见问题之一,在本文章中,我们将提供一些有用的提示和技巧,帮助您解决可能出现的蓝牙连接问... 蓝牙作为一种流行的无线技术,已经成为我们连接各种设备的重要工具。在 MAC 上,你可以根据自己的需求,轻松地