吴恩达2022机器学习专项课程(一) 4.2 梯度下降实践

2024-03-29 15:52

本文主要是介绍吴恩达2022机器学习专项课程(一) 4.2 梯度下降实践,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

问题预览/关键词

  1. 本节内容
  2. 梯度下降更新w的公式
  3. 梯度下降更新b的公式
  4. =的含义
  5. α的含义
  6. 为什么要控制梯度下降的幅度?
  7. 导数项的含义
  8. 为什么要控制梯度下降的方向?
  9. 梯度下降何时结束?
  10. 梯度下降算法收敛的含义
  11. 正确更新梯度下降的顺序
  12. 错误更新梯度下降的顺序

笔记

1.本节内容

如何实现梯度下降算法

2.梯度下降更新w的公式

在这里插入图片描述

3.梯度下降更新b的公式

在这里插入图片描述

4.=的含义

表示计算机中的赋值操作,不能理解成数学中的等于操作。

5.α的含义:

希腊字母,表示学习率,通常为0-1之间很小的数,如0.01。它用来控制梯度下降的幅度。α越大,下降的步子越大。α很小,则一点点向下走。

6.为什么要控制梯度下降的幅度

控制梯度下降的幅度:学习率过高,下降幅度太大,无法下降到最低点,学习率过低,下降幅度太小,影响算法性能。

  • 如何选择合适的α:4.4课节会详细说明。

7.导数项的含义

用来控制梯度下降的方向。

  • 计算J关于w的偏导数

在这里插入图片描述

  • 计算J关于b的偏导数。
    在这里插入图片描述

8.为什么要控制梯度下降的方向?

只有控制方向,才能尽快的到达函数的局部或全局最小值。

  • 为什么求导能控制方向?4.3课节会详细说明。

  • 导数如何计算?4.5课节会详细说明。

9.梯度下降何时结束

不断更新w和b直到算法收敛,梯度下降就可以停止了。

  • 自行设置停止条件,在第一周lab_05实验代码,设置迭代10000次后自动停止。在这里插入图片描述

10.梯度下降算法收敛

优化过程中,算法逐步逼近问题的最优解或局部最优解。在线性回归中,表示梯度下降更新的w和b,已经达到成本函数J的局部最小值,此时w,b不怎么改变了。

11.更新梯度下降的正确顺序

先用旧的w和b计算,计算完成在更新w和b,即同步更新。
在这里插入图片描述

12.更新梯度下降的错误顺序

计算w然后更新w,导致计算b的过程里使用了新的w,旧的w被忽略了,导致w,b没有同步更新。
在这里插入图片描述

总结

梯度下降的具体操作是要更新w,b,公式为计算学习率乘以J关于w或b的偏导数,然后将结果赋值给新的w和b,一直重复上述过程,直到w,b的值不怎么改变了。公式中的=符号表示赋值操作,α(学习率)控制梯度下降的步幅,导数项控制梯度下降的方向。在更新w,b的时候,我们要做到同步更新。先计算旧的w,b,然后将结果更新给新的w,b。

这篇关于吴恩达2022机器学习专项课程(一) 4.2 梯度下降实践的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/859006

相关文章

Linux shell编程~学习笔记

case语句 case语句的通配符及多个模式组合 !/bin/bashcase $1 in[dD]ate) echo "the date is `date`";;dir|path) echo "current diectory is `pwd`";;*) echo "bad argument";;esac `date` 和 `pwd` 处不是英文中的单引号,而是Esc键下面的那个

树状数组(学习小结)

树状数组 树状数组是一种数据结构,它可以高效处理对一个存储数字的列表进行更新和维护前缀和 已知一个长度为n的数组,现在要实现以下操作: 更新某个位置的值,查询前i个数的和,查询区间[i,j]的和 upData(i, val): 在i位置加上valquery(i):查询区间从第一个数到第i个数的和getSum(i, j): 计算第i个数到第j个数的和 树状数组和线段树 树状数组可线段

gin学习1-7

package mainimport ("github.com/gin-gonic/gin""net/http")// 响应json还有其他响应差不多可以去学func _string(c *gin.Context) {c.String(http.StatusOK, "lalal")}func _json(c *gin.Context) {//json响应结构体type UsetInfo s

【PyTorch与深度学习】2、PyTorch张量的运算API(上)

课程地址 最近做实验发现自己还是基础框架上掌握得不好,于是开始重学一遍PyTorch框架,这个是课程笔记,这个课还是讲的简略,我半小时的课听了一个半小时。 1. 张量 1.1 张量操作 (1)chunk:将一个张量分割为特定数目的张量,每个块都是输入张量的视图。 按维度0分割: import torchb = torch.rand([3, 2]) # 随机生成3x2维度的张量prin

上市企业数字赋能指数数据集-2001到2022年(TF-IDF)

01、数据简介 上市公司数字赋能指数是一个用来衡量上市公司利用数字技术提高业务能力和效率的指标。这个指数反映了上市公司利用大数据、云计算和人工智能等数字技术,高效地利用商业资源和信息,并扩展供应关系的能力。市公司数字赋能指数是一种综合性的评价指标,通过数字赋能指数的评价,可以推动企业实现数字化转型,提高企业的竞争力和可持续发展能力。 数字化转型在企业发展中扮演着重要的角色。随着中国上市公司年报

软件测试之学习及复习面试路线汇总

对于很多想通过自学或面试复习软件测试的同学,痛点并不是学习动力,而是找不到清晰的学习思路。 熬夜3天,吐血整理了这份《软件测试学习路线》,全文接近6000字,请大家耐心看完! 软件测试职业成长图  第一阶段:软件测试基础理论 基础理论知识作为软件测试工程师入门的第一步,这一部分内容是贯穿了整个软件测试职业生涯的重要知识点。尤为重要的是测试相关的技术概念、测试用例设计、项目需求分析、

MATLAB语音信号分析与合成——MATLAB语音信号分析学习资料汇总(图书、代码和视频)

教科书:MATLAB语音信号分析与合成(第2版) 链接(含配套源代码):https://pan.baidu.com/s/1pXMPD_9TRpJmubPGaRKANw?pwd=32rf  提取码:32rf 基础入门视频: 视频链接: 清华大学_信号处理与语音分析 配套练习: 任务:利用线性预测模型,寻找 汉语韵母 的共振峰 • 第 1 步:在安静的环境中,

后端学习记录~~JavaSE篇(Module08-异常 上 )

总览: Java概述: 思维导图文件在本人个人主页上-----资源模块 资源详情(免费下载):Java学习思维导图异常篇资源-CSDN文库https://download.csdn.net/download/m0_61589682/89238330 整体展示:

extJs 2.0学习笔记(事件注册总结篇)

extJs 2.0学习笔记(事件注册总结篇)   本来,我也没把这档子事放在眼里,因为简单,例如:   Ext.get("elem").on("click",{fn:function(){alert("此元素被单击了!");}};   这样的代码谁不会写啊。一个on就了结了。但是,今天,我在研究Ext.Panel的tbar时,发现,那现工具栏按钮的事件注册不一样:   元素注册、组件注

机器视觉系统-工业光源什么是平行背光

光路描述:通过平行结构使光源发出平行光。 效果分析:平行光能够精确得到不规则被测物的外轮廓,使诸如园柱形产品,或有倒角、园角的产品边缘成像清晰、税利。一般配合远心镜头使用,精度很高。 主要应用:尺寸测量。 常用光源:平行面光、平行同轴光。