Linear Regression 的闭式解以及梯度下降方法【机器学习】

2024-01-27 11:59

本文主要是介绍Linear Regression 的闭式解以及梯度下降方法【机器学习】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  (胡乱写的,仅供自己学习)

  机器学习的第一次实验是线性回归的闭式解以及梯度下降。

一、闭式解

  闭式解的原理很简单,就是损失函数(Loss Function)进行求导,当导数等于零的时候就是损失函数值最小的时候,这时就可以求出参数了。

  我们采用如下的损失函数:

对其进行求导: 

 

 当导数等于零时,

w 即我们所求的参数矩阵。

二、梯度下降

  梯度就是导数,对损失函数的求导。

  在数分中,梯度意味着函数值增加最快的方向。所以要让损失函数值减小得最快,只需要取反方向就好。那么应该让自变量变化多少呢?或者说让自变量变化多快?变化得过快就会导致自变量直接越过最优解得位置。或者还有回来得可能?答案是没有。自变量会在最优解得附件不断徘徊而无法变成最优解。所以自变量变化的速度就需要控制得慢一点了。但是如果太慢了呢?那会导致自变量到达最优解需要的时间和计算机的消耗都会变得很大。所以又需要控制得快一点了。那么问题是这个自变量变化的速度应该多快呢?具体问题具体分析。这个速度就是实际应用的时候应该去调的参数了。

  有个比喻就是下山,具体还是看这个博客吧(懒得写了)(42条消息) 机器学习-梯度下降算法原理及公式推导_taoKingRead的博客-CSDN博客_梯度下降公式

  至于说,全批量梯度下降的方法,随机梯度下降方法和小批量梯度方法的区别到底在哪里?答案是在于样本的选择。随机梯度只选择了一个样本,小批量顾名思义就是选部分样本,全批量就是选全部样本。

  为什么不用闭式解就好,还有这个梯度方法?因为计算机在求解指数函数,对数函数之类的函数的闭式解时效果不是很好,计算机在计算这些函数的时候采用的时近似求解的方法,比如泰勒展开式,所花的时间和计算资源很大。然后就有了梯度下降的方法。

这篇关于Linear Regression 的闭式解以及梯度下降方法【机器学习】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/650188

相关文章

Python清空Word段落样式的三种方法

《Python清空Word段落样式的三种方法》:本文主要介绍如何用python-docx库清空Word段落样式,提供三种方法:设置为Normal样式、清除直接格式、创建新Normal样式,注意需重... 目录方法一:直接设置段落样式为"Normal"方法二:清除所有直接格式设置方法三:创建新的Normal样

在Linux系统上连接GitHub的方法步骤(适用2025年)

《在Linux系统上连接GitHub的方法步骤(适用2025年)》在2025年,使用Linux系统连接GitHub的推荐方式是通过SSH(SecureShell)协议进行身份验证,这种方式不仅安全,还... 目录步骤一:检查并安装 Git步骤二:生成 SSH 密钥步骤三:将 SSH 公钥添加到 github

把Python列表中的元素移动到开头的三种方法

《把Python列表中的元素移动到开头的三种方法》在Python编程中,我们经常需要对列表(list)进行操作,有时,我们希望将列表中的某个元素移动到最前面,使其成为第一项,本文给大家介绍了把Pyth... 目录一、查找删除插入法1. 找到元素的索引2. 移除元素3. 插入到列表开头二、使用列表切片(Lis

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也

Java Thread中join方法使用举例详解

《JavaThread中join方法使用举例详解》JavaThread中join()方法主要是让调用改方法的thread完成run方法里面的东西后,在执行join()方法后面的代码,这篇文章主要介绍... 目录前言1.join()方法的定义和作用2.join()方法的三个重载版本3.join()方法的工作原

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

Spring Boot从main方法到内嵌Tomcat的全过程(自动化流程)

《SpringBoot从main方法到内嵌Tomcat的全过程(自动化流程)》SpringBoot启动始于main方法,创建SpringApplication实例,初始化上下文,准备环境,刷新容器并... 目录1. 入口:main方法2. SpringApplication初始化2.1 构造阶段3. 运行阶

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方