转载的 损失函数MSE L1 优化函数ADAM SGD 优化算法等

2024-03-20 08:08

本文主要是介绍转载的 损失函数MSE L1 优化函数ADAM SGD 优化算法等,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

如有侵权,请联系删除!

pytorch框架中损失函数与优化器介绍:

目录

1. 损失函数:

1.1 nn.L1Loss

1.2 nn.SmoothL1Loss

1.3 nn.MSELoss

1.4 nn.BCELoss

1.5 nn.CrossEntropyLoss

1.6 nn.NLLLoss

1.7 nn.NLLLoss2d

2.优化器Optim

2.1 使用

2.2 基类 Optimizer

2.3 方法

3. 优化算法

3.1 随机梯度下降算法 SGD算法

3-2 平均随机梯度下降算法 ASGD算法

3-3 Adagrad算法

3-4 自适应学习率调整 Adadelta算法

3-5 RMSprop算法

3-6 自适应矩估计 Adam算法

3-7 Adamax算法(Adamd的无穷范数变种)

3-8 SparseAdam算法

3-9 L-BFGS算法

3-10 弹性反向传播算法 Rprop算法

1.1 nn.L1Loss的主要形式 

1.2 nn.SmoothL1Loss

1.3 nn.MSELoss

1.4 nn.BCELoss

1.5 nn.CrossEntropyLoss

1.6 nn.NLLLoss

1.7 nn.NLLLoss2d

这些参数都比较的经典,需要认真的学习

根据主要梯度下降的方向进行优化,

比如爬山,如果找到最低点,那么肯定朝着最陡峭(梯度最大)的反方向去下坡,会最快的走到最低点

那么沿着梯度反方向,随机更新一下梯度,然后可以找到一个最值,进而慢慢的找到最值

处理随机更新梯度,还有很多的方法 比如随机小批量  小批量等等

图 一个求解过程

 

提取找寻的过程

 

import numpy as np
from mpl_toolkits.mplot3d import Axes3D
import numpy as np
from matplotlib import pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号
%matplotlib inline
#  二元一次函数图像
fig = plt.figure()
ax = Axes3D(fig)
x = np.arange(-10, 10, 1)
y = np.arange(-10, 10, 1)
X, Y = np.meshgrid(x, y)  # 网格的创建,生成二维数组,这个是关键
Z = (1 - X) ** 2 + 100 * (Y - X ** 2) ** 2
Z=Z
plt.xlabel('x')
plt.ylabel('y')
# 将函数显示为3d,rstride和cstride代表row(行)和column(列)的跨度cmap为色图分类
ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='rainbow')
plt.show()

    
    
def cal_rosenbrock(x1, x2):
    """
    计算rosenbrock函数的值
    :param x1:
    :param x2:
    :return:
    """
    return (1 - x1) ** 2 + 100 * (x2 - x1 ** 2) ** 2+3


def cal_rosenbrock_prax(x1, x2):
    """
    对x1求偏导
    """
    return -2 + 2 * x1 - 400 * (x2 - x1 ** 2) * x1

def cal_rosenbrock_pray(x1, x2):
    """
    对x2求偏导
    """
    return 200 * (x2 - x1 ** 2)

def for_rosenbrock_func(max_iter_count=100000, step_size=0.001):
    pre_x = [1.5,1.5]#np.zeros((2,), dtype=np.float32)
    loss = 10
    iter_count = 0
    x1=[]
    y1=[]
    z1=[]
    while loss > 0.0001 and iter_count < max_iter_count:
        error = np.zeros((2,), dtype=np.float32)
        error[0] = cal_rosenbrock_prax(pre_x[0], pre_x[1])
        error[1] = cal_rosenbrock_pray(pre_x[0], pre_x[1])

        for j in range(2):
            pre_x[j] -= step_size * error[j]
        ww1=cal_rosenbrock(pre_x[0], pre_x[1])
        loss = cal_rosenbrock(pre_x[0], pre_x[1])-3  # 最小值为0
        
        if iter_count%400==0:
            #print("iter_count: ", iter_count, "the loss:", loss, "SHUZHI:", ww1)
            #  二元一次函数图像
            #fig = plt.figure()
            #ax = Axes3D(fig)
            x = np.arange(-10, 10, 1)
            y = np.arange(-10, 10, 1)
            X, Y = np.meshgrid(x, y)  # 网格的创建,生成二维数组,这个是关键
            Z = (1 - X) ** 2 + 100 * (Y - X ** 2) ** 2
            Z=Z
            #plt.xlabel('x')
            #plt.ylabel('y')
            x1.append(pre_x[0])
            y1.append(pre_x[1])
            z1.append(0+loss)
            # 将函数显示为3d,rstride和cstride代表row(行)和column(列)的跨度cmap为色图分类
            #ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='rainbow')
            #ax.scatter(pre_x[0], pre_x[1],loss, c='red',s=250, label='sss')#, c=None, depthshade=True, *args, *kwargs)
            #plt.show()
            #plt.plot(pre_x[0], pre_x[1],loss, s=100)#, label='acc')
        iter_count += 1
        #print(x1,y1,z1)
    print('ok1')
    return pre_x,x1,y1,z1

if __name__ == '__main__':
    %matplotlib inline
    w,x1,y1,z1 = for_rosenbrock_func() 
    
    #print(w,x1,y1,z1)
    fig = plt.figure()
    #ax = Axes3D(fig)
    ax= plt.axes(projection='3d')
    #ax.set_xlim(1, 1.5)  # X轴,横向向右方向
    #ax.set_ylim(1, 1.5)  # Y轴,左向与X,Z轴互为垂直
    #ax.set_zlim(1, 35)  # 竖向为Z轴
    x = np.arange(-10, 10, 1)
    y = np.arange(-10, 10, 1)
    X, Y = np.meshgrid(x, y)  # 网格的创建,生成二维数组,这个是关键
    Z = (1 - X) ** 2 + 100 * (Y - X ** 2) ** 2
    Z=Z
    plt.xlabel('x')
    plt.ylabel('y')

    # 将函数显示为3d,rstride和cstride代表row(行)和column(列)的跨度cmap为色图分类
    ax.plot_surface(X, Y, Z, rstride=1, cstride=1, cmap='rainbow')
    ax.scatter(x1,y1,z1, c='red',s=150)#, c=None, depthshade=True, *args, *kwargs)
    
    #plt.xlim(1, 1.5)
    #plt.ylim(1, 1.5)
    #plt.zlim(1, 31.5)

    plt.show()
    fig = plt.figure()
    ax = Axes3D(fig)
    ax.scatter(x1,y1,z1, c='red',s=150)#, c=None, depthshade=True, *args, *kwargs)
    plt.show()
    #ax.scatter(x1, y1, z1, s=20, c=None, depthshade=True, *args, *kwargs)
    plt.show()

这篇关于转载的 损失函数MSE L1 优化函数ADAM SGD 优化算法等的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/828815

相关文章

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

python中的高阶函数示例详解

《python中的高阶函数示例详解》在Python中,高阶函数是指接受函数作为参数或返回函数作为结果的函数,下面:本文主要介绍python中高阶函数的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录1.定义2.map函数3.filter函数4.reduce函数5.sorted函数6.自定义高阶函数

Python中的sort方法、sorted函数与lambda表达式及用法详解

《Python中的sort方法、sorted函数与lambda表达式及用法详解》文章对比了Python中list.sort()与sorted()函数的区别,指出sort()原地排序返回None,sor... 目录1. sort()方法1.1 sort()方法1.2 基本语法和参数A. reverse参数B.

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化:通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

Docker多阶段镜像构建与缓存利用性能优化实践指南

《Docker多阶段镜像构建与缓存利用性能优化实践指南》这篇文章将从原理层面深入解析Docker多阶段构建与缓存机制,结合实际项目示例,说明如何有效利用构建缓存,组织镜像层次,最大化提升构建速度并减少... 目录一、技术背景与应用场景二、核心原理深入分析三、关键 dockerfile 解读3.1 Docke

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱