支持向量机SVM与逻辑斯谛回归LR区别

2024-05-24 20:18

本文主要是介绍支持向量机SVM与逻辑斯谛回归LR区别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

逻辑回归模型

逻辑回归模型是一种分类模型,由条件概率分布P(Y|X) 表示,形式为参数化的逻辑分布,这里,随机变量X取值为实数,随机变量Y取值为1或0。

在学习逻辑回归时大家总是将线性回归作比较,线性回归模型的输出一般是连续

在线性回归模型中每一个输入x,都有一个对应的y输出。模型的定义域和值域都可以是[-∞, +∞]。但是逻辑回归输入可以是连续的[-∞, +∞],输出却一般是离散的,即只有有限个多个输出值。例如值域可以只有两个值{0,1},这两个值可以表示对样本的某种分类(高/低,好/坏等),这就是常见的二分类逻辑回归。因此,从整体上来说,通过LR我们可以将整个实数范围上的x映射到了有限个点上,这样就实现了对X的分类

LR与SVM的相同点

  • LR和SVM都是分类算法;
  • 如果不考虑核函数,LR和SVM都是线性分类算法,也就是它们的分类决策面都是线性的;
  • SVM只考虑局部的边界线附近的点,而LR考虑全局(远离的点对边界线的确定也起作用)。

影响SVM决策面的样本点只有少数的结构支持向量,当在支持向量外添加或减少任何样本点对分类决策面没有任何影响;而在LR中,每个样本点都会影响决策面的结果。

a.SVM改变非支持向量样本并不会引起决策面的变化


b.LR中改变任何样本都会引起决策面的变化


  • LR和SVM都是监督学习。
  • LR和SVM都是判别模型

判别模型会生成一个表示P(Y|X)的判别函数(或预测模型),而生成模型先计算联合概率p(Y,X)然后通过贝叶斯公式转化为条件概率。简单来说,在计算判别模型时,不会计算联合概率,而在计算生成模型时,必须先计算联合概率

常见的判别模型有:SVM、LR,条件随机场(CRF),CART,最大熵,决策树

常见的生成模型有:朴素贝叶斯,隐马尔可夫模型,贝叶斯网络,KNN,马尔科夫随机场(MRF)



LR与SVM的不同

  • 本质上是两者的损失函数的不同
逻辑回归一般使用交叉熵作为损失函数:

SVM损失函数:


其中, m:训练样本的个数;hθ(x):用参数θ和x预测出来的y值;y:原训练样本中的y值,也就是标准答案; 上角标(i):第i个样本

  • 线性SVM依赖数据表达的距离测度,所以需要对数据先做Normalization,  LR不受其影响;
要说有什么本质区别,那就是两个模型对数据和参数的敏感程度不同,因为SVM在计算margin有多“宽”的时候依赖数据表达上的距离测度,如果这个测度不好,所求得的Large margin就没有意义了,这个问题即使换用kernel trick也无法避免。所以使用SVM之前都需要先对数据进行Normalization,而求解LR时候则不需要或者结果不敏感。
  • 在解决非线性问题时,SVM采用核函数的机制,而LR通常不采用核函数

这个问题理解起来非常简单。分类模型的结果就是计算决策面,模型训练的过程就是决策面的计算过程。通过上面的第二点不同点可以了解,在计算决策面时,SVM算法里只有少数几个代表支持向量的样本参与了计算,也就是只有少数几个样本需要参与核计算(即kernal machine解的系数是稀疏的)。然而,LR算法里,每个样本点都必须参与决策面的计算过程,也就是说,假设我们在LR里也运用核函数的原理,那么每个样本点都必须参与核计算,这带来的计算复杂度是相当高的。所以,在具体应用时,LR很少运用核函数机制。

  • SVM与LR学习算法

LR学习算法有: 改进的迭代尺度算法,梯度下降,拟牛顿法

SVM学习算法: 序列最小优化算法(SMO)

  • SVM的损失函数就自带正则(损失函数中的1/2||w||^2项),这就是为什么SVM就是结构风险最小化算法的原因,而LR必须另外在损失函数上添加正则项,关于正则化可参考我的另一篇博客:https://blog.csdn.net/u010899985/article/details/79471909


这篇关于支持向量机SVM与逻辑斯谛回归LR区别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/999426

相关文章

MySQL逻辑删除与唯一索引冲突解决方案

《MySQL逻辑删除与唯一索引冲突解决方案》本文探讨MySQL逻辑删除与唯一索引冲突问题,提出四种解决方案:复合索引+时间戳、修改唯一字段、历史表、业务层校验,推荐方案1和方案3,适用于不同场景,感兴... 目录问题背景问题复现解决方案解决方案1.复合唯一索引 + 时间戳删除字段解决方案2:删除后修改唯一字

JAVA覆盖和重写的区别及说明

《JAVA覆盖和重写的区别及说明》非静态方法的覆盖即重写,具有多态性;静态方法无法被覆盖,但可被重写(仅通过类名调用),二者区别在于绑定时机与引用类型关联性... 目录Java覆盖和重写的区别经常听到两种话认真读完上面两份代码JAVA覆盖和重写的区别经常听到两种话1.覆盖=重写。2.静态方法可andro

C++中全局变量和局部变量的区别

《C++中全局变量和局部变量的区别》本文主要介绍了C++中全局变量和局部变量的区别,全局变量和局部变量在作用域和生命周期上有显著的区别,下面就来介绍一下,感兴趣的可以了解一下... 目录一、全局变量定义生命周期存储位置代码示例输出二、局部变量定义生命周期存储位置代码示例输出三、全局变量和局部变量的区别作用域

MyBatis中$与#的区别解析

《MyBatis中$与#的区别解析》文章浏览阅读314次,点赞4次,收藏6次。MyBatis使用#{}作为参数占位符时,会创建预处理语句(PreparedStatement),并将参数值作为预处理语句... 目录一、介绍二、sql注入风险实例一、介绍#(井号):MyBATis使用#{}作为参数占位符时,会

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

Javaee多线程之进程和线程之间的区别和联系(最新整理)

《Javaee多线程之进程和线程之间的区别和联系(最新整理)》进程是资源分配单位,线程是调度执行单位,共享资源更高效,创建线程五种方式:继承Thread、Runnable接口、匿名类、lambda,r... 目录进程和线程进程线程进程和线程的区别创建线程的五种写法继承Thread,重写run实现Runnab

C++中NULL与nullptr的区别小结

《C++中NULL与nullptr的区别小结》本文介绍了C++编程中NULL与nullptr的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编... 目录C++98空值——NULLC++11空值——nullptr区别对比示例 C++98空值——NUL

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Go语言中make和new的区别及说明

《Go语言中make和new的区别及说明》:本文主要介绍Go语言中make和new的区别及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1 概述2 new 函数2.1 功能2.2 语法2.3 初始化案例3 make 函数3.1 功能3.2 语法3.3 初始化

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现