第一周-机器学习-梯度下降(gradient descent)

2024-05-02 02:58

本文主要是介绍第一周-机器学习-梯度下降(gradient descent),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 这仅是本人在cousera上学习机器学习的笔记,不能保证其正确性,谨慎参考

1、梯度下降函数,一直重复下面公式直到收敛(repeat until convergence),此时即可收敛得到局部最小值(converge to local minimum),该梯度下降法对多参数也可用(例如θ0,θ1,θ2,θ3,θ4,θ5……θn),注意该过程对每一次的j迭代是需要同步更新参数的(At each iteration j, one should simultaneously update the parameters),而且每迭代一次,需要用到数据集的所有数据(映射函数J(θ0,θ1)的表达式要用到)共n次。α表示学习速率(learning rate),当α越大时,每一次迭代的跨步越大,可以参考第2点的3维图:
这里写图片描述

2、图形化理解(intuition),每一个小黑点代表一次迭代,(θ0,θ1)同时变换,直到迭代至收敛:
这里写图片描述

3、假设θ0=0,然后采用梯度下降法(gradient descent)来处理代价函数J(θ1),偏导数可以控制梯度下降的方向,是θ1往j(θ1)减小的方向改变
这里写图片描述

4、α即学习速率(learning rate)的作用,控制梯度下降的幅度,α过大会导致跳过收敛(fail to converge)或者偏离(diverge),过小则导致到达收敛的速度慢,且计算量增加:

这里写图片描述

5、梯度下降的具体过程,随着接近local minimum,偏导数(绿框框住的)会逐渐变小,梯度下降的步子会变得更小,因此不需要过度的减小α:
这里写图片描述

6、不假设θ0=0的情况,用梯度下降法来求最小化的平方代价误差函数(minimize squared error cost function):
这里写图片描述

7、求J(θ0,θ1)偏导数:
这里写图片描述
这里写图片描述

8、拟合数据集的过程:
- 初始(通常都将θ0,θ1初始化为0,这里为了看到明显效果,初始化数据如图,拟合过程根据的是7中求偏微分后的方程):
这里写图片描述

  • 拟合直至J(θ0,θ1)收敛,红点的每一步相当7中偏微分方程的一次迭代:
    这里写图片描述

9、批量梯度下降(“patch”gradient descent),每一次迭代需要用到所有的训练集(即批量之意):
这里写图片描述

10、练习,偏导数会随着迭代次数增加而变小,从而是梯度下降的步子变小,从而接近收敛值,a错,c对(kept fixed为固定的意思)。线性回归的J函数图像为一个锅头形状,只存在一个收敛值,也是最小值,d对。梯度下降求的是local minimum,而不是global minimum:
这里写图片描述

注:图片来源都为 机器学习-吴恩达 中的视频截图

这篇关于第一周-机器学习-梯度下降(gradient descent)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/953258

相关文章

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

C/C++的OpenCV 进行图像梯度提取的几种实现

《C/C++的OpenCV进行图像梯度提取的几种实现》本文主要介绍了C/C++的OpenCV进行图像梯度提取的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录预www.chinasem.cn备知识1. 图像加载与预处理2. Sobel 算子计算 X 和 Y

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

pytorch自动求梯度autograd的实现

《pytorch自动求梯度autograd的实现》autograd是一个自动微分引擎,它可以自动计算张量的梯度,本文主要介绍了pytorch自动求梯度autograd的实现,具有一定的参考价值,感兴趣... autograd是pytorch构建神经网络的核心。在 PyTorch 中,结合以下代码例子,当你

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

css渐变色背景|<gradient示例详解

《css渐变色背景|<gradient示例详解》CSS渐变是一种从一种颜色平滑过渡到另一种颜色的效果,可以作为元素的背景,它包括线性渐变、径向渐变和锥形渐变,本文介绍css渐变色背景|<gradien... 使用渐变色作为背景可以直接将渐China编程变色用作元素的背景,可以看做是一种特殊的背景图片。(是作为背

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert