有监督分类:概率分类法(Logistic)

2023-12-02 11:48

本文主要是介绍有监督分类:概率分类法(Logistic),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.前言

前面我介绍的都是确定模式所属类别的模式识别算法。对于模式基于概率进行分类的手法称为概率分类法。这是这一篇博客重点讨论的内容。
基于概率的模式识别,是指与模式x所对应的类别y的后验概率p(y|x)进行学习。其所属类别为后延概率达到最大值时所对应的类别。

类别的后验概率p(y=y'|x).可以理解为模式x属于类别y的可信度。通过这样的方法,在可信度非常低的时候就不用强行进行分类,从而避免了错误分类,而且可以设置一些实用的选项,比如吧这样的样本丢掉。另外,基于概率的模式识别还有一个优势,就是对于多种类别分类问题通常会有较好的分类结果。

2.Logistic回归

先谈一谈简单又实用的Logistic回归。

2.1 Logistic模型的最大似然估计

Logistic回归,使用线性对数函数对分类后验概率p(y|x)进行模型化。

上式中,分母是与所有的y=1,...,c对应的,满足概率总和为1的约束条件的正则化项。上述的模型q(y|x:Θ)中包含的参数{Θj}j=1->b,在每个类别y=1,...,c中都不一样,因此包含所有参数的向量Θ有bc次维。

Logistic回归模型的学习,通过对数似然为最大师的最大似然估计进行求解。
似然函数是指,将手头的训练样本{(xi,yi)}i=1->n由现在的模型生成的概率,看作是关于参数Θ的函数,对数似然是指其对数:

似然是q(yi|xi,Θ)经过n次相乘的结果,例如对于所有的i=1,...,n,q(yi|xi,Θ)=0.1的时候,其似然:

是一个非常小的值,经常会发生丢为的现象。对于这种情况,一般使用对数来解决,即利用将乘法变换为加法的方法来防止丢位现象的发生。
Logistic回归学习模型有下事的最优化问题来定义:
上面的目标函数对于参数Θ是可以微分的,因此我们还可以用梯度下降策略来求最大似然估计的解Θ’。
概率梯度下降法的Logistic回归学习算法如下图所示:

2.2 对数高斯模型

下图表示的是对对数高斯核模型进行Logistic回归学习的实例。

在该例中,高斯核的带宽h=1。

通过结果,我们可以看出,类别的后验概率P(y|x)得到了很好的学习。

2.3 使用Logistic损失最小化学习来解释

首先从2分类问题y∈{+1,-1}进行说明:

通过使用上述关系式,Logistic模型的参数个数就可以由2b个降为b个。

这个模型的对数似然最大化的准则:

可以改写为上述形式。根据关于参数的线性模型:
的间隔m=fΘ(x)y,可以知道上式与使用Logistic损失:

的Logistic损失最小化学习是等价的。如下图所示:

Logistic损失函数

3.最小二乘概率分类

这里只是简单性回顾一下在平方误差准则下进行与Logistic回归相同学习的最小二乘概率分类器。
最小二乘概率分类器,对于各个类别y=1,...,c的后验概率p(y|x),使用于参数相关的线性模型:

进行模型化。与Logistic模型不同的是,这个模型仅仅依赖与各个类别y对应的参数

然后,对这个模型进行学习,是下面的平方误差最小:

上式中,P(x)表示的是训练输入样本的概率密度函数。
上式的第二项可以进行变形为:

上式中,p(x|y)是属于类别y的训练输入样本的概率密度函数,p(y)表示的是训练输出样本{yi}i=1->n的概率密度函数。
我们应该注意到,Jy中包含了如下比较难以处理的:

分别表示与p(x)和P(x|y)相关的数学期望值。这些期望值一般无法直接计算,而是采用样本的平均值进行模拟

应该注意的是,对于Jy,他的第三项与Θ无关,所以没必要再研究。此外,我们引入L2正则化项,得到如下的计算准则:

可以发现,这个学习准则是关于Θ的凸二次式,对其进行偏微分并置零可以得到最优解。

然而,如果按照上式计算,类别的后验概率可能会出现负的。因此,需要对负的输出加一个下届为零的约束条件:

下面是最小二乘概率分类的例子,使用的数据与Logistic回归数据一致,分类结果如下图所示:

最小二乘概率分类的实例

4.总结

最小二乘概率分类器能够得到与Logistic回归基本相同的学习结果。Logistic回归模型包括正则项,因此,与各个类别的基函数个数b和类别c相对应,其参数个数为bc个。另一方面,最小二乘概率分类器使用了没有正则化的线性模型,所以是对有b个参数的模型,对各类别进行c次独立学习的过程。在类别数c很大的情况下,最小二乘概率分类效率更高一点。
同时,由于Logistic回归学习包含非线性的对数函数,必须要通过反复迭代的方式进行求解,需要花费大量的学习时间。但是,最小而成概率分类器中可以得到解析解,更有效率。
但是,最小二乘概率分类器也不是完美无瑕的。因为,最小二乘概率分类器的输出为概率的形式,所以需要进行一系列的后期处理。在样本容量很大的情况下,后续处理几乎没影响,范式当训练样本非常小的情况下,就会导致学习效率低下
因此,一般的处理方式是,当训练样本是较多的时候,采用最小二乘分类器;而当训练样本较少的时候,则采用Logistic回归方法。

这篇关于有监督分类:概率分类法(Logistic)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/445230

相关文章

Pandas使用AdaBoost进行分类的实现

《Pandas使用AdaBoost进行分类的实现》Pandas和AdaBoost分类算法,可以高效地进行数据预处理和分类任务,本文主要介绍了Pandas使用AdaBoost进行分类的实现,具有一定的参... 目录什么是 AdaBoost?使用 AdaBoost 的步骤安装必要的库步骤一:数据准备步骤二:模型

C#使用DeepSeek API实现自然语言处理,文本分类和情感分析

《C#使用DeepSeekAPI实现自然语言处理,文本分类和情感分析》在C#中使用DeepSeekAPI可以实现多种功能,例如自然语言处理、文本分类、情感分析等,本文主要为大家介绍了具体实现步骤,... 目录准备工作文本生成文本分类问答系统代码生成翻译功能文本摘要文本校对图像描述生成总结在C#中使用Deep

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

认识、理解、分类——acm之搜索

普通搜索方法有两种:1、广度优先搜索;2、深度优先搜索; 更多搜索方法: 3、双向广度优先搜索; 4、启发式搜索(包括A*算法等); 搜索通常会用到的知识点:状态压缩(位压缩,利用hash思想压缩)。

hdu4865(概率DP)

题意:已知前一天和今天的天气概率,某天的天气概率和叶子的潮湿程度的概率,n天叶子的湿度,求n天最有可能的天气情况。 思路:概率DP,dp[i][j]表示第i天天气为j的概率,状态转移如下:dp[i][j] = max(dp[i][j, dp[i-1][k]*table2[k][j]*table1[j][col] )  代码如下: #include <stdio.h>#include

用Pytho解决分类问题_DBSCAN聚类算法模板

一:DBSCAN聚类算法的介绍 DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的聚类算法,DBSCAN算法的核心思想是将具有足够高密度的区域划分为簇,并能够在具有噪声的空间数据库中发现任意形状的簇。 DBSCAN算法的主要特点包括: 1. 基于密度的聚类:DBSCAN算法通过识别被低密

机器学习之监督学习(三)神经网络

机器学习之监督学习(三)神经网络基础 0. 文章传送1. 深度学习 Deep Learning深度学习的关键特点深度学习VS传统机器学习 2. 生物神经网络 Biological Neural Network3. 神经网络模型基本结构模块一:TensorFlow搭建神经网络 4. 反向传播梯度下降 Back Propagation Gradient Descent模块二:激活函数 activ

PMP–一、二、三模–分类–14.敏捷–技巧–看板面板与燃尽图燃起图

文章目录 技巧一模14.敏捷--方法--看板(类似卡片)1、 [单选] 根据项目的特点,项目经理建议选择一种敏捷方法,该方法限制团队成员在任何给定时间执行的任务数。此方法还允许团队提高工作过程中问题和瓶颈的可见性。项目经理建议采用以下哪种方法? 易错14.敏捷--精益、敏捷、看板(类似卡片)--敏捷、精益和看板方法共同的重点在于交付价值、尊重人、减少浪费、透明化、适应变更以及持续改善等方面。

【python计算机视觉编程——8.图像内容分类】

python计算机视觉编程——8.图像内容分类 8.图像内容分类8.1 K邻近分类法(KNN)8.1.1 一个简单的二维示例8.1.2 用稠密SIFT作为图像特征8.1.3 图像分类:手势识别 8.2贝叶斯分类器用PCA降维 8.3 支持向量机8.3.2 再论手势识别 8.4 光学字符识别8.4.2 选取特征8.4.3 多类支持向量机8.4.4 提取单元格并识别字符8.4.5 图像校正

PMP–一、二、三模–分类–14.敏捷–技巧–原型MVP

文章目录 技巧一模14.敏捷--原型法--项目生命周期--迭代型生命周期,通过连续的原型或概念验证来改进产品或成果。每个新的原型都能带来新的干系人新的反馈和团队见解。题目中明确提到需要反馈,因此原型法比较好用。23、 [单选] 一个敏捷团队的任务是开发一款机器人。项目经理希望确保在机器人被实际建造之前,团队能够收到关于需求的早期反馈并相应地调整设计。项目经理应该使用以下哪一项来实现这个目标?