【机器学习基础】概率分布之变量

2024-04-05 04:38

本文主要是介绍【机器学习基础】概率分布之变量,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本系列为《模式识别与机器学习》的读书笔记。

一,二元变量

1,二项分布

考虑⼀个⼆元随机变量 x ∈ { 0 , 1 } x \in \{0, 1\} x{0,1}。 例如, x x x 可能描述了扔硬币的结果, x = 1 x = 1 x=1 表⽰“正⾯”, x = 0 x = 0 x=0 表⽰反⾯。我们可以假设有⼀个损坏的硬币,这枚硬币正⾯朝上的概率未必等于反⾯朝上的概率。 x = 1 x = 1 x=1 的概率被记作参数 μ \mu μ,因此有:
p ( x = 1 ∣ μ ) = μ (2.1) p(x=1|\mu) = \mu\tag{2.1} p(x=1μ)=μ(2.1)
其中 0 ≤ μ ≤ 1 0\le \mu\le 1 0μ1 x x x 的概率分布因此可以写成:
Bern ( x ∣ μ ) = μ x ( 1 − μ ) 1 − x (2.2) \text {Bern}(x|\mu) = \mu^{x}(1-\mu)^{1-x}\tag{2.2} Bern(xμ)=μx(1μ)1x(2.2)
这被叫做伯努利分布Bernoulli distribution)。容易证明,这个分布是归⼀化的,并且均值和⽅差分别为:
E [ x ] = μ (2.3) \mathbb{E}[x] = \mu\tag{2.3} E[x]=μ(2.3)

var [ x ] = μ ( 1 − μ ) (2.4) \text{var}[x] = \mu(1-\mu)\tag{2.4} var[x]=μ(1μ)(2.4)

如图 2.1: ⼆项分布关于 m m m 的函数的直⽅图,其中 N = 10 N = 10 N=10 μ = 0.25 \mu = 0.25 μ=0.25
二项分布
假设我们有⼀个 x x x 的观测值的数据集 D = { x 1 , … , x N } \mathcal{D} = \{x_1 ,\dots, x_N\} D={x1,,xN}。假设每次观测都是独⽴地从 p ( x ∣ μ ) p(x | \mu) p(xμ) 中抽取的,因此可以构造关于 μ \mu μ 的似然函数:
p ( D ∣ μ ) = ∏ n = 1 N p ( x n ∣ μ ) = ∏ n = 1 N μ x n ( 1 − μ ) 1 − x n (2.5) p(\mathcal{D}|\mu) = \prod_{n=1}^{N}p(x_{n}|\mu) = \prod_{n=1}^{N}\mu^{x_{n}}(1-\mu)^{1-x_{n}}\tag{2.5} p(Dμ)=n=1Np(xnμ)=n=1Nμxn(1μ)1xn(2.5)
其对数似然函数:
ln ⁡ p ( D ∣ μ ) = ∑ n = 1 N ln ⁡ p ( x n ∣ μ ) = ∑ n = 1 N { x n ln ⁡ μ + ( 1 − x n ) ln ⁡ ( 1 − μ ) } (2.6) \ln p(\mathcal{D}|\mu) = \sum_{n=1}^{N}\ln p(x_{n}|\mu) = \sum_{n=1}^{N}\{ x^n \ln \mu + (1-x^n) \ln (1-\mu)\}\tag{2.6} lnp(Dμ)=n=1Nlnp(xnμ)=n=1N{xnlnμ+(1xn)ln(1μ)}(2.6)
在公式(2.6)中,令 ln ⁡ p ( D ∣ μ ) \ln p(\mathcal{D}|\mu) lnp(Dμ) 关于 μ \mu μ 的导数等于零,就得到了最⼤似然的估计值,也被称为样本均值sample mean):
μ M L = 1 N ∑ n = 1 N x n (2.7) \mu_{ML} = \frac{1}{N} \sum_{n=1}^{N} x_{n}\tag{2.7} μML=N1n=1Nxn(2.7)
求解给定数据集规模 N

这篇关于【机器学习基础】概率分布之变量的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/877642

相关文章

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

Linux基础命令@grep、wc、管道符的使用详解

《Linux基础命令@grep、wc、管道符的使用详解》:本文主要介绍Linux基础命令@grep、wc、管道符的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录grep概念语法作用演示一演示二演示三,带选项 -nwc概念语法作用wc,不带选项-c,统计字节数-

python操作redis基础

《python操作redis基础》Redis(RemoteDictionaryServer)是一个开源的、基于内存的键值对(Key-Value)存储系统,它通常用作数据库、缓存和消息代理,这篇文章... 目录1. Redis 简介2. 前提条件3. 安装 python Redis 客户端库4. 连接到 Re

SpringBoot基础框架详解

《SpringBoot基础框架详解》SpringBoot开发目的是为了简化Spring应用的创建、运行、调试和部署等,使用SpringBoot可以不用或者只需要很少的Spring配置就可以让企业项目快... 目录SpringBoot基础 – 框架介绍1.SpringBoot介绍1.1 概述1.2 核心功能2

java变量内存中存储的使用方式

《java变量内存中存储的使用方式》:本文主要介绍java变量内存中存储的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍2、变量的定义3、 变量的类型4、 变量的作用域5、 内存中的存储方式总结1、介绍在 Java 中,变量是用于存储程序中数据

Spring Boot集成SLF4j从基础到高级实践(最新推荐)

《SpringBoot集成SLF4j从基础到高级实践(最新推荐)》SLF4j(SimpleLoggingFacadeforJava)是一个日志门面(Facade),不是具体的日志实现,这篇文章主要介... 目录一、日志框架概述与SLF4j简介1.1 为什么需要日志框架1.2 主流日志框架对比1.3 SLF4

Spring Boot集成Logback终极指南之从基础到高级配置实战指南

《SpringBoot集成Logback终极指南之从基础到高级配置实战指南》Logback是一个可靠、通用且快速的Java日志框架,作为Log4j的继承者,由Log4j创始人设计,:本文主要介绍... 目录一、Logback简介与Spring Boot集成基础1.1 Logback是什么?1.2 Sprin

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

MySQL复合查询从基础到多表关联与高级技巧全解析

《MySQL复合查询从基础到多表关联与高级技巧全解析》本文主要讲解了在MySQL中的复合查询,下面是关于本文章所需要数据的建表语句,感兴趣的朋友跟随小编一起看看吧... 目录前言:1.基本查询回顾:1.1.查询工资高于500或岗位为MANAGER的雇员,同时还要满足他们的姓名首字母为大写的J1.2.按照部门

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen