【深度学习】Focal Loss 损失函数

2024-08-21 19:12

本文主要是介绍【深度学习】Focal Loss 损失函数,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Focal Loss 损失函数

1. Focal Loss 介绍

Focal Loss 是一种专门设计用于处理类别不平衡问题的损失函数,特别是在目标检测任务中表现出色。它最早由 Facebook AI Research (FAIR) 提出的,在物体检测中,如 RetinaNet,解决了正负样本严重不平衡的问题。
论文链接:Focal Loss for Dense Object Detection

2. 背景

在许多实际应用中,如目标检测,类别不平衡是一个常见问题。例如,在一个图像中,背景(负样本)通常占据大多数,而目标物体(正样本)很少。传统的交叉熵损失(Cross-Entropy Loss)可能会导致模型过度关注负样本,从而忽视正样本,特别是难以检测的正样本。Focal Loss 通过将注意力集中在难以分类的样本上,来解决这个问题。

3. Focal Loss 定义

Focal Loss 的公式如下:
F L ( p t ) = − α t ( 1 − p t ) γ l o g ( p t ) FL(p_t) = -\alpha _t(1-p_t)^\gamma log(p_t) FL(pt)=αt(1pt)γlog(pt)

其中

  • p t p_t pt 是模型对目标类的预测概率
  • α t \alpha _t αt平衡因子,用于调整正负样本之间的影响。
  • γ \gamma γ焦点因子,用于调整难易样本的权重。

(1) 交叉熵损失

Focal Loss 基于二分类交叉熵损失(Binary Cross-Entropy Loss)。传统的交叉熵损失可以表示为:
B C E ( p t ) = − l o g ( p t ) BCE(p_t) = -log(p_t) BCE(pt)=log(pt)
其中, p t p_t pt 是模型对正确类别的预测概率。

(2) 平衡因子 α t \alpha_t αt

平衡正负样本: α t \alpha_t αt 用于平衡正负样本的影响,防止负样本过多对损失的贡献:

  • 对于正样本, α t = α \alpha_t = \alpha αt=α
  • 对于负样本, α t = 1 − α \alpha_t = 1-\alpha αt=1α

通常, α \alpha α 的值在 [0,1] 之间,表示正负样本的权重比例。对于目标检测任务, α \alpha α可以设为正样本和负样本的比例。

(3) 焦点因子 γ \gamma γ

焦点因子 γ \gamma γ:通过引入焦点因子 γ \gamma γFocal Loss 调整了模型对易分类样本和难分类样本的关注程度。公式中的 ( 1 − p t ) γ (1-p_t)^\gamma (1pt)γ部分是关键:

  • 当预测概率 p t p_t pt 接近 1(即样本容易分类), ( 1 − p t ) γ (1-p_t)^\gamma (1pt)γ会非常小,减少了损失的贡献。
  • 当预测概率 p t p_t pt 接近 0(即样本难以分类), ( 1 − p t ) γ (1-p_t)^\gamma (1pt)γ 会变大,增加了损失的权重,从而让模型更加关注这些难分类的样本。

焦点因子 γ \gamma γ 通常设为2,但可以根据具体问题调整。更大的 γ \gamma γ 会使得模型更加专注于难分类样本。

4. 使用场景

  • 目标检测:Focal Loss 最初用于目标检测任务,如 RetinaNet,因为目标检测中的正负样本严重不平衡。通过聚焦于难分类的目标,Focal Loss 提高了模型对目标的检测能力。
  • 其他类别不平衡任务:Focal Loss 也可以应用于其他类别不平衡的分类任务,如文本分类或医学图像分析。

5. Focal Loss代码实现(Pytorch)

# -*- coding: utf-8 -*-
# @time: 2024/8/21 16:54import torch
import torch.nn as nn# Focal Loss 的 PyTorch 示例实现
class FocalLoss(nn.Module):def __init__(self, alpha=0.25, gamma=2, reduction='mean'):super(FocalLoss, self).__init__()self.alpha = alphaself.gamma = gammaself.reduction = reductiondef forward(self, inputs, targets):# 计算 logits 的 sigmoid 概率p = torch.sigmoid(inputs)# 计算交叉熵损失bce_loss = nn.functional.binary_cross_entropy_with_logits(inputs, targets, reduction='none')# 计算 Focal Lossalpha = self.alpha * targets + (1 - self.alpha) * (1 - targets)focal_loss = alpha * ((1 - p) ** self.gamma) * bce_loss# 根据 reduction 参数进行损失归约if self.reduction == 'mean':return focal_loss.mean()elif self.reduction == 'sum':return focal_loss.sum()else:return focal_loss# 使用示例
criterion = FocalLoss(alpha=0.25, gamma=2)
inputs = torch.randn(4, requires_grad=True)
targets = torch.empty(4).random_(2)
loss = criterion(inputs, targets)print(inputs)
print(targets)
print(loss)

输出结果

tensor([-0.7896, -0.1952, -0.7318, -2.2900], requires_grad=True)
tensor([0., 0., 0., 1.])
tensor(0.2236, grad_fn=<MeanBackward0>)

6. 总结

Focal Loss 是一种处理类别不平衡问题的有效方法,通过引入焦点因子和调整样本权重,使得模型对难以分类的样本更加关注,从而提高分类性能。它特别适用于目标检测和其他类别不平衡的任务。

这篇关于【深度学习】Focal Loss 损失函数的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1094040

相关文章

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

python中的高阶函数示例详解

《python中的高阶函数示例详解》在Python中,高阶函数是指接受函数作为参数或返回函数作为结果的函数,下面:本文主要介绍python中高阶函数的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录1.定义2.map函数3.filter函数4.reduce函数5.sorted函数6.自定义高阶函数

Python中的sort方法、sorted函数与lambda表达式及用法详解

《Python中的sort方法、sorted函数与lambda表达式及用法详解》文章对比了Python中list.sort()与sorted()函数的区别,指出sort()原地排序返回None,sor... 目录1. sort()方法1.1 sort()方法1.2 基本语法和参数A. reverse参数B.

Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧

《Python函数的基本用法、返回值特性、全局变量修改及异常处理技巧》本文将通过实际代码示例,深入讲解Python函数的基本用法、返回值特性、全局变量修改以及异常处理技巧,感兴趣的朋友跟随小编一起看看... 目录一、python函数定义与调用1.1 基本函数定义1.2 函数调用二、函数返回值详解2.1 有返

Python Excel 通用筛选函数的实现

《PythonExcel通用筛选函数的实现》本文主要介绍了PythonExcel通用筛选函数的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录案例目的示例数据假定数据来源是字典优化:通用CSV数据处理函数使用说明使用示例注意事项案例目的第一

C++统计函数执行时间的最佳实践

《C++统计函数执行时间的最佳实践》在软件开发过程中,性能分析是优化程序的重要环节,了解函数的执行时间分布对于识别性能瓶颈至关重要,本文将分享一个C++函数执行时间统计工具,希望对大家有所帮助... 目录前言工具特性核心设计1. 数据结构设计2. 单例模式管理器3. RAII自动计时使用方法基本用法高级用法