斯坦福机器学习 Lecture2 （假设函数、参数、样本等等术语，还有批量梯度下降法、随机梯度下降法 SGD 以及它们的相关推导，还有正态方程）

2023-11-20 13:01

文章标签 参数函数学习方程机器相关批量术语正态梯度 sgd 下降随机样本推导斯坦福假设 lecture2

本文主要是介绍斯坦福机器学习 Lecture2 （假设函数、参数、样本等等术语，还有批量梯度下降法、随机梯度下降法 SGD 以及它们的相关推导，还有正态方程），希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

假设函数定义
假设函数，猜一个 x->y 的类型，比如 y = ax + b，随后监督学习的任务就是找到误差最低的 a 和 b 参数

在这里插入图片描述
有时候我们可以定义 x0 = 1，来让假设函数的整个表达式一致统一

在这里插入图片描述
如上图是机器学习中的一些术语

在这里插入图片描述
额外的符号，使用 (xi, yi) 表示第 i 个样本

n 表示特征数量（在房屋价格预测问题中，属性/特征有两个：房子面积和卧室数量，因此这里 n = 2）

在这里插入图片描述
监督学习的过程就是选择合适的参数，来让假设函数的输出和样本输出相近（针对训练集）

在这里插入图片描述
房屋预测案例中的目标函数，最小化误差平方和

在这里插入图片描述
我们通常会在目标函数旁边放个 1/2，这是为了后边简化求导计算

在这里插入图片描述

我们通常使用梯度下降法来选取更加合适的 theta参数来优化目标函数，如上图是梯度下降法中的 “baby step”

这里的阿尔法就是学习速率

在这里插入图片描述
如图，是对目标函数的求导（由于对几个项的和求导，等于它们的导数和，所以这里我们先不 care 那个 sum(sigma) 符号）

在这里插入图片描述

如图，是对求导公式的后续转换

在这里插入图片描述
如图，这是对目标函数求导的最终公式的其中一项（这里只对 theta_j 求导）

在这里插入图片描述

这也是最后统合得到的求导公式，对每一个样本 i 进行针对 theta_j 的求导

接下来要做的就是，重复 updating theta_j，直到目标函数收敛

在这里插入图片描述
由于我们的目标函数对于每个 theta_j 都是二次函数，所以这是一个凸函数，它是一个大碗，它只有一个全局最优

在这里插入图片描述
也可以用等高线图来表示

运用高中的一些数学知识，你会发现，最陡的防线和等高线（椭圆）的切线是90度

调试学习率的一些经验：
如果你发现目标函数在增加而不是减少，那通常说明学习率太大了（超调）
可以尝试 O1, O2， O4, O8 尝试不同的值

在这里插入图片描述

另一种可视化学习过程的方式是，看到曲线（假设函数）一点点变化

刚刚提到的机器学习方法中，梯度下降需要用到训练集中所有的样本，来计算梯度（所以也叫批量梯度下降法）。在训练集很大的情况下，这会变得昂贵，因此我们需要做些改变

在这里插入图片描述
另一种快得多的方式是随机梯度下降法，它遍历每一个样本 i，随后针对这单个样本对所有的 theta_j 做梯度下降

（原先的方法中，我们每做一个 tiny step 都需要扫描一次所有的样本；而 SGD 中，我们每走一个 step 只需要扫描一个样本，因此快得多）

一个更直观的解释 SGD 的方式是，一开始我的 theta 参数是随机的，然后我看到了第一个样本 x1，随后我针对这个 x1 修改的我 theta，接着我看到了 x2，我再针对 x2 修改我的 theta。在等高线图中，你可能会看到，参数并没有沿着 90 度的方向下降，而是以一种更曲折的方式下降

SGD 通常不会收敛，它会振荡

还有一种下降方法是“小批量梯度下降法”，一次遍历100个样本

还有一种实践中的方法（一点点减少学习速率）

线性回归没有局部最优（在它的目标函数是误差平方和时），只有全局最优。所以，实际上你可以使用一个矩阵去表示它的参数，求cost function(目标函数）对于参数矩阵的求导，随后让导数 = 0，求这个位置上的导数矩阵，即可直接得到全局最优解。这也叫做正态方程，这个方法仅适用于线性回归

在这里插入图片描述
根据吴恩达的推导，正态方程，也就是最终最优的 theta 可以通过这么一个公式求出来

如果发现 X 不可逆，那么通常意味着有多余的 features，你有某些 features 是线性相关的，你可以使用伪逆，或者找出哪些特征是线性相关的

关于怎么选择学习率：这非常依赖经验，通常我们尝试许多个不同的值，然后选择一个

这篇关于斯坦福机器学习 Lecture2 （假设函数、参数、样本等等术语，还有批量梯度下降法、随机梯度下降法 SGD 以及它们的相关推导，还有正态方程）的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/394793。 23002807@qq.com

相关文章

Python函数作用域与闭包举例深度解析

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,：本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1：访问全局变量示例2：访问外层函数变量2. 闭包基础示例3：简单闭包示例4

阅读更多...

Python中isinstance()函数原理解释及详细用法示例

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

阅读更多...

python中的高阶函数示例详解

python中的高阶函数示例详解

《python中的高阶函数示例详解》在Python中,高阶函数是指接受函数作为参数或返回函数作为结果的函数,下面：本文主要介绍python中高阶函数的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录1.定义2.map函数3.filter函数4.reduce函数5.sorted函数6.自定义高阶函数

阅读更多...

Python中的sort方法、sorted函数与lambda表达式及用法详解

Python中的sort方法、sorted函数与lambda表达式及用法详解

《Python中的sort方法、sorted函数与lambda表达式及用法详解》文章对比了Python中list.sort()与sorted()函数的区别,指出sort()原地排序返回None,sor... 目录1. sort()方法1.1 sort()方法1.2 基本语法和参数A. reverse参数B.

阅读更多...

Ubuntu向多台主机批量传输文件的流程步骤

Ubuntu向多台主机批量传输文件的流程步骤

《Ubuntu向多台主机批量传输文件的流程步骤》：本文主要介绍在Ubuntu中批量传输文件到多台主机的方法,需确保主机互通、用户名密码统一及端口开放,通过安装sshpass工具,准备包含目标主机信... 目录Ubuntu 向多台主机批量传输文件1.安装 sshpass2.准备主机列表文件3.创建一个批处理脚

阅读更多...

C#中通过Response.Headers设置自定义参数的代码示例

C#中通过Response.Headers设置自定义参数的代码示例

《C#中通过Response.Headers设置自定义参数的代码示例》：本文主要介绍C#中通过Response.Headers设置自定义响应头的方法,涵盖基础添加、安全校验、生产实践及调试技巧,强... 目录一、基础设置方法1. 直接添加自定义头2. 批量设置模式二、高级配置技巧1. 安全校验机制2. 类型

阅读更多...

MySQL批量替换数据库字符集的实用方法(附详细代码)

MySQL批量替换数据库字符集的实用方法(附详细代码)

《MySQL批量替换数据库字符集的实用方法(附详细代码)》当需要修改数据库编码和字符集时,通常需要对其下属的所有表及表中所有字段进行修改,下面：本文主要介绍MySQL批量替换数据库字符集的实用方法... 目录前言为什么要批量修改字符集？整体脚本脚本逻辑解析1. 设置目标参数2. 生成修改表默认字符集的语句3

阅读更多...

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

阅读更多...

Python Excel 通用筛选函数的实现

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化：通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

阅读更多...

SpringBoot分段处理List集合多线程批量插入数据方式

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案：通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

阅读更多...