统计学习方法——逻辑斯蒂回归与最大熵模型

2023-12-26 21:58

本文主要是介绍统计学习方法——逻辑斯蒂回归与最大熵模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

逻辑斯蒂回归(LR)是统计学习中的经典分类方法。最大熵是概率模型学习的一个准则,将其推广到分类问题得到最大熵模型。逻辑斯蒂回归模型与最大熵模型都属于对数线性模型。

1、逻辑斯蒂回归模型

线性回归与逻辑回归关系:

在学习逻辑回归时,常常会联想到线性回归。线性回归一般预测解决连续值预测的问题,对已有的数据进行线性拟合,运用最小二乘法等,找到最佳拟合曲线,然后得到线性模型,来进行预测,是一个线性模型。而逻辑回归时一个非线性模型,sigmoid函数,又称逻辑回归函数。用于解决分类问题,输出某个类别的概率。如果把逻辑回归拆开,其本质也是线性回归模型。因为除了sigmoid映射函数外,其他步骤都是线性回归。sigmoid能轻松出列0、1分类问题。

逻辑斯蒂回归模型定义及来源

(1)一阶逻辑斯蒂回归

逻辑斯蒂回归模型主要是来源于逻辑斯蒂分布与逻辑斯蒂函数。当然,如果换一个名字,你对它应当相当熟悉,那就是sigmoid函数。它的形式如下:

                                                                                        f(x) = \frac{1}{1+e^{-x}}

而逻辑斯蒂回归模型的另一个则来源于线性回归:

                                                                    

把两者组合起来,就形成了大名鼎鼎的十大数据挖掘算法(LR):

                                                                   

f(x)的值是一个0到1之间的数。

(2)二项逻辑斯蒂回归模型

二项回归模型是如下的条件概率分布:

                                                                          P(Y=1|X) = \frac{e^{\omega · x+b}}{1+e^{\omega · x+b}}

                                                                         P(Y=0|X) = \frac{1}{1+e^{\omega · x+b}}

这里,x\in R^{n}是输入,Y\in 0 to 1是输出,w,b是参数,wx是w,x的内积。

在学习逻辑斯蒂回归模型的特点是,要涉及到一个名词“几率”。一个事件的几率是指该时间发生的概率与该事件不发生的概率的比值。如果发生的概率是p,那么,该事件的几率是:\frac{P}{1-P},对事件的对数几率或logit函数是

                                                                              

所以,对逻辑斯蒂回归而言,综合可得式子:

                                                                     

这里可以看出,输出y=1的对数几率是输入x的线性函数

 

(3)模型参数估计

现在大致模型已经知道了,参数未知。只要计算得出模型的参数就可得到具体模型。

这里采用极大似然估计法作为参数估计,把问题变成以似然函数为目标函数的最优化问题

                                                

     这样,问题就变成了以对数似然函数为目标函数的最优化问题。逻辑斯蒂回归学习中通常采用的方法是梯度下降法及拟牛顿法。

                                         

 

 

似然函数可以看做是条件概率的逆反

例子:

一枚硬币,已知正反面朝上的概率各自是pH = 0.5。若投两次都正面朝上的概率是0.25,用条件概率表示,就是:

P(HH | pH = 0.5) = 0.5^{2} = 0.25        H表示正面朝上

在统计学中,我们关心的是在已知一系列投掷的结果时,关于硬币投掷时正面朝上的可能性的信息。我们可以建立一个统计模型:假设硬币投出时会有pH 的概率正面朝上,而有1 − pH 的概率反面朝上。这时,条件概率可以改写成似然函数:

L(pH = 0.5|HH ) = P(HH | pH = 0.5) = 0.25

也就是说,对于取定的似然函数,在观测到两次投掷都是正面朝上时,pH = 0.5 的似然性是0.25(这并不表示当观测到两次正面朝上时pH = 0.5 的概率是0.25)

如果pH=0.6 ,那么似然函数的值也会变化成0.36

注意到似然函数的值变大了。这说明,如果参数pH 的取值变成0.6的话,结果观测到连续两次正面朝上的概率要比假设pH = 0.5时更大。也就是说,参数pH 取成0.6 要比取成0.5 更有说服力,更为“合理”。总之,似然函数的重要性不是它的具体取值,而是当参数变化时函数到底变小还是变大。对同一个似然函数,如果存在一个参数值,使得它的函数值达到最大的话,那么这个值就是最为“合理”的参数值。

在这个例子中,似然函数实际上等于:

(4)多项逻辑斯蒂回归

逻辑斯蒂回归模型可以是二分类模型,用于二分类问题。也可以推广为多项逻辑斯蒂回归模型,用于多分类问题。

                           

 

2、最大熵模型

先了解什么是最大熵原理

 最大熵原理 是 学习概率模型时,在所有可能的概率模型(分布)中,熵最大的模型是最好的模型。

计算最大熵根据两个前提去解决问题:

1. 解决问题要满足一定约束 

2. 不做任何假设,就是在约束外的事件发生概率为等概率

直观地,最大熵原理认为要选择的概率模型首先必须满足已有的事实,即约束条件。在没有更多信息的情况下,哪些不确定的部分都是“等可能的”。最大熵原理通过熵的最大化来表示等可能性。

简而言之,除了约束条件外,其他发生概率都是相等的。

 

模型的定义,即找到模型集合中熵最大的模型。

最大熵模型的学习

最大熵的学习形式可以化为约束最优化问题。

先将最大值问题等价成一个最小值问题。再将最优化原始问题转换成无约束最优化的对偶问题。通过对偶问题求解原始问题。这个方法在支持向量机的推导过程中也有涉及。对偶问题的概述后续再补充

 

Note:

逻辑斯蒂回归模型、最大熵模型学习归结为以似然函数为目标函数的最优化问题,通常通过迭代算法求解。从最优化的观点看,这时的目标函数具有很好的性质。它是光滑的凸函数,因此多种最优化的方法都适用,保证能找到全局最优解。

逻辑斯蒂回归模型与最大熵模型都属于对数线性模型。
逻辑斯蒂回归模型及最大熵模型学习一般采用极大似然估计,或正则化的极大似然估计。逻辑斯蒂回归模型及最大熵模型学习可以形式化为无约束最优化问题。求解该最优化问题的算法由改进的迭代尺度法、梯度下降法、拟牛顿法

 

reference:

https://blog.csdn.net/weixin_40499753/article/details/82977623

这篇关于统计学习方法——逻辑斯蒂回归与最大熵模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/540913

相关文章

Java 枚举的基本使用方法及实际使用场景

《Java枚举的基本使用方法及实际使用场景》枚举是Java中一种特殊的类,用于定义一组固定的常量,枚举类型提供了更好的类型安全性和可读性,适用于需要定义一组有限且固定的值的场景,本文给大家介绍Jav... 目录一、什么是枚举?二、枚举的基本使用方法定义枚举三、实际使用场景代替常量状态机四、更多用法1.实现接

java String.join()方法实例详解

《javaString.join()方法实例详解》String.join()是Java提供的一个实用方法,用于将多个字符串按照指定的分隔符连接成一个字符串,这一方法是Java8中引入的,极大地简化了... 目录bVARxMJava String.join() 方法详解1. 方法定义2. 基本用法2.1 拼接

java连接opcua的常见问题及解决方法

《java连接opcua的常见问题及解决方法》本文将使用EclipseMilo作为示例库,演示如何在Java中使用匿名、用户名密码以及证书加密三种方式连接到OPCUA服务器,若需要使用其他SDK,原理... 目录一、前言二、准备工作三、匿名方式连接3.1 匿名方式简介3.2 示例代码四、用户名密码方式连接4

springboot项目中使用JOSN解析库的方法

《springboot项目中使用JOSN解析库的方法》JSON,全程是JavaScriptObjectNotation,是一种轻量级的数据交换格式,本文给大家介绍springboot项目中使用JOSN... 目录一、jsON解析简介二、Spring Boot项目中使用JSON解析1、pom.XML文件引入依

IDEA中Maven Dependencies出现红色波浪线的原因及解决方法

《IDEA中MavenDependencies出现红色波浪线的原因及解决方法》在使用IntelliJIDEA开发Java项目时,尤其是基于Maven的项目,您可能会遇到MavenDependenci... 目录一、问题概述二、解决步骤2.1 检查 Maven 配置2.2 更新 Maven 项目2.3 清理本

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

java中BigDecimal里面的subtract函数介绍及实现方法

《java中BigDecimal里面的subtract函数介绍及实现方法》在Java中实现减法操作需要根据数据类型选择不同方法,主要分为数值型减法和字符串减法两种场景,本文给大家介绍java中BigD... 目录Java中BigDecimal里面的subtract函数的意思?一、数值型减法(高精度计算)1.

CentOS 7 YUM源配置错误的解决方法

《CentOS7YUM源配置错误的解决方法》在使用虚拟机安装CentOS7系统时,我们可能会遇到YUM源配置错误的问题,导致无法正常下载软件包,为了解决这个问题,我们可以替换YUM源... 目录一、备份原有的 YUM 源配置文件二、选择并配置新的 YUM 源三、清理旧的缓存并重建新的缓存四、验证 YUM 源

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

MySQL启动报错:InnoDB表空间丢失问题及解决方法

《MySQL启动报错:InnoDB表空间丢失问题及解决方法》在启动MySQL时,遇到了InnoDB:Tablespace5975wasnotfound,该错误表明MySQL在启动过程中无法找到指定的s... 目录mysql 启动报错:InnoDB 表空间丢失问题及解决方法错误分析解决方案1. 启用 inno