激活函数 activate function

2023-12-24 14:36

本文主要是介绍激活函数 activate function,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 激活函数,决定神经网络是否传递信息的开关

    • ReLU,Recitified Linear Unit,线性整流函数,常见的是 ReLU 和 Leaky ReLU。通常意义下,线性整流函数指代数学中的斜坡函数
      f ( x ) = max ⁡ ( 0 , x ) f(x) = \max (0, x) f(x)=max(0,x)
      ReLU 可以对抗梯度爆炸 / 消失的问题,相对而言计算效率也很高

    • GELU,Gaussian Error Linear Unit,高斯误差线性单元

      • 对于输入值 x,根据 x 的情况,乘上 1 或者 0,即对于每一个输入 x,服从标准正态分布 N ( 0 , 1 ) N(0, 1) N(0,1),再给其乘上一个伯努利分布 ϕ ( x ) = P ( X ≤ x ) \phi(x) = P(X \leq x) ϕ(x)=P(Xx)
        x P ( X ≤ x ) = x ϕ ( x ) xP(X \leq x) = x \phi(x) xP(Xx)=xϕ(x)
        其中 ϕ ( x ) \phi(x) ϕ(x) x x x 的高斯分布;
        x P ( X ≤ x ) = x ∫ − ∞ x e − ( X − μ ) 2 2 σ 2 2 π σ d X xP(X \leq x) = x \int \nolimits _{-\infty} ^{x} \frac{e^{-\frac{(X - \mu)^2}{2 \sigma^2}}}{\sqrt{2 \pi \sigma}}dX xP(Xx)=xx2πσ e2σ2(Xμ)2dX
        → \rightarrow
        g e l u ( x ) = 0.5 x ( 1 + tanh ⁡ ( 2 π ( x + 0.044715 x 3 ) ) ) gelu(x) = 0.5x(1+\tanh(\sqrt{\frac{2}{\pi}}(x+0.044715x^3))) gelu(x)=0.5x(1+tanh(π2 (x+0.044715x3)))
    • x x x 越大的时候,就越有可能被保留,越小就越有可能被置零

    • relu, r e l u ( x ) = max ⁡ ( x , 0 ) relu(x) = \max(x, 0) relu(x)=max(x,0)

    • sigmoid, s i g m o i d ( x ) = 1 1 + e − x sigmoid(x) = \frac{1}{1+e^{-x}} sigmoid(x)=1+ex1

    • tanh
      sinh ⁡ ( x ) = e x − e − x 2 cosh ⁡ ( x ) = e x + e − x 2 tanh ⁡ ( x ) = sinh ⁡ ( x ) cosh ⁡ ( x ) \sinh(x) = \frac{e^x - e^{-x}}{2} \\ \cosh(x) = \frac{e^x + e^{-x}}{2} \\ \tanh(x) = \sinh(x)\cosh(x) sinh(x)=2exexcosh(x)=2ex+extanh(x)=sinh(x)cosh(x)

    • silu, s i l u ( x ) = x ∗ s i g m o i d ( x ) = x 1 + e − x silu(x) = x * sigmoid(x) = \frac{x}{1+e^{-x}} silu(x)=xsigmoid(x)=1+exx

    • gelu
      g e l u ( x ) ≈ 0.5 x ( 1 + tanh ⁡ ( 2 π ( x + 0.044715 x 3 ) ) ) ≈ x × s i g m o i d ( 1.702 x ) gelu(x) \approx 0.5x(1+\tanh(\sqrt{\frac{2}{\pi}}(x+0.044715x^3))) \\ \approx x \times sigmoid(1.702x) gelu(x)0.5x(1+tanh(π2 (x+0.044715x3)))x×sigmoid(1.702x)

    • mish, m i s h ( x ) = x × tanh ⁡ ( s o f t p l u e ( x ) ) = x × tanh ⁡ ( ln ⁡ ( a + e x ) ) mish(x) = x \times \tanh(softplue(x)) = x \times \tanh(\ln(a + e^x)) mish(x)=x×tanh(softplue(x))=x×tanh(ln(a+ex))

    激活函数近似是往负无穷大方向走,逐渐趋近 y = a y = a y=a 的直线;往正无穷大的方向走,逐渐趋近 y = x y = x y=x

这篇关于激活函数 activate function的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/532115

相关文章

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

python中的高阶函数示例详解

《python中的高阶函数示例详解》在Python中,高阶函数是指接受函数作为参数或返回函数作为结果的函数,下面:本文主要介绍python中高阶函数的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录1.定义2.map函数3.filter函数4.reduce函数5.sorted函数6.自定义高阶函数

Python中的sort方法、sorted函数与lambda表达式及用法详解

《Python中的sort方法、sorted函数与lambda表达式及用法详解》文章对比了Python中list.sort()与sorted()函数的区别,指出sort()原地排序返回None,sor... 目录1. sort()方法1.1 sort()方法1.2 基本语法和参数A. reverse参数B.

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化:通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法

GO语言中函数命名返回值的使用

《GO语言中函数命名返回值的使用》在Go语言中,函数可以为其返回值指定名称,这被称为命名返回值或命名返回参数,这种特性可以使代码更清晰,特别是在返回多个值时,感兴趣的可以了解一下... 目录基本语法函数命名返回特点代码示例命名特点基本语法func functionName(parameters) (nam

Python Counter 函数使用案例

《PythonCounter函数使用案例》Counter是collections模块中的一个类,专门用于对可迭代对象中的元素进行计数,接下来通过本文给大家介绍PythonCounter函数使用案例... 目录一、Counter函数概述二、基本使用案例(一)列表元素计数(二)字符串字符计数(三)元组计数三、C

Python中的filter() 函数的工作原理及应用技巧

《Python中的filter()函数的工作原理及应用技巧》Python的filter()函数用于筛选序列元素,返回迭代器,适合函数式编程,相比列表推导式,内存更优,尤其适用于大数据集,结合lamb... 目录前言一、基本概念基本语法二、使用方式1. 使用 lambda 函数2. 使用普通函数3. 使用 N