三个臭皮匠——集成学习AdaBoost简单代码实现示例

本文主要是介绍三个臭皮匠——集成学习AdaBoost简单代码实现示例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转载自[https://zhuanlan.zhihu.com/p/27126737]

三个臭皮匠——AdaBoost简单代码实现示例

    • 转载内容(引子)
    • 第一个学习器
      • 封装函数(python)
      • 第一轮误差
    • 第二个学习器
      • 第二轮误差
    • 第三个学习器
      • 第三轮误差
    • 总结

转载内容(引子)

集成学习概念
例题

第一个学习器

返回顶部

import numpy as np
import pandas as pddata = {'x':[i for i in range(10)], 'y':[1, 1, 1, -1, -1, -1, 1, 1, 1, -1]}
df = pd.DataFrame(data, columns=['x', 'y'])
df['w'] = 0.1
df
xyw
0010.1
1110.1
2210.1
33-10.1
44-10.1
55-10.1
6610.1
7710.1
8810.1
99-10.1

封装函数(python)

返回顶部
正函数(小于分界点为1,大于分界点为-1,reverse = True)
负函数(小于分界点为-1,大于分界点为1,reverse = False)

def find_min(df, reverse=True):# 正函数g_p = lambda x,s:int(x < s) * 2 - 1  # 满足时1 * 2 - 1 = 1;不满足时0 * 2 - 1 = -1# 负函数g_n = lambda x,s:int(x > s) * 2 - 1g = g_p if reverse else g_nx = df['x']e_idx = 1  # 误差权重初值x_idx = 0  # 误差权重初值对应分界点   for i in x:df_temp = df.copy(deep=True)df_temp['e'] = 0     # 将['e']属性先统一赋值0df_temp['G'] = df_temp['x'].apply(lambda x: g(x, i - 0.5))df_temp.loc[df_temp['y'] != df_temp['G'], ['e']] = df_temp['w']  # 当['y']属性与['G']属性不一致时,['e']为其权重e = df_temp['e'].sum()  # 误差(['y']与['G']不一致)权重求和if e < e_idx:           # 找最小误差权重及其对应分界点e_idx, x_idx = e, (i - 0.5)return g, round(e_idx, 3), round(x_idx, 1)
def find_func(df):g_p, e_p, s_p = find_min(df)  # 正函数返回误差及对应分界点g_n, e_n, s_n = find_min(df, reverse = False)  # 负函数返回误差及对应分界点if e_p < e_n:  # 选择误差较小的正函数(或负函数)return g_p, e_p, s_preturn g_n, e_n, s_n
def alpha(df):g, e, split = find_func(df)alpha = round((1.0 / 2) * (np.log(1 - e) - np.log(e)), 4)df['G'] = df['x'].apply(lambda x: g(x, split))df['w'] = round(df['w']* np.exp(-alpha * df['y'] * df['G']), 4)df['w'] = round(df['w'] / (df['w'].sum()), 4)return g, split, alpha

第一个学习器

g1, split1, alpha1 = alpha(df)
alpha1
0.4236
func =lambda x:np.sign(alpha1 * g1(x, split1))
df['G'] = df['x'].apply(lambda x: int(func(x)))
df
xywG
0010.07151
1110.07151
2210.07151
33-10.0715-1
44-10.0715-1
55-10.0715-1
6610.1666-1
7710.1666-1
8810.1666-1
99-10.0715-1

第一轮误差

返回顶部
第一轮误差

df.loc[df['y'] != df['G'], ['x']].count()
x    3
dtype: int64

第二个学习器

返回顶部
第二个学习器

g2, split2, alpha2 = alpha(df)
alpha2
0.6505
func =lambda x:np.sign(alpha1 * g1(x, split1) + alpha2 * g2(x, split2))
df['G'] = df['x'].apply(lambda x: int(func(x)))
df
xywG
0010.04541
1110.04541
2210.04541
33-10.16691
44-10.16691
55-10.16691
6610.10591
7710.10591
8810.10591
99-10.0454-1

第二轮误差

返回顶部
第二轮误差

df.loc[df['y'] != df['G'], ['x']].count()
x    3
dtype: int64

第三个学习器

返回顶部
第三个学习器

g3, split3, alpha3 = alpha(df)
alpha3
0.7514
func =lambda x:np.sign(alpha1 * g1(x, split1) + alpha2 * g2(x, split2) + alpha3 * g3(x, split3))
df['G'] = df['x'].apply(lambda x: int(func(x)))
df
xywG
0010.12481
1110.12481
2210.12481
33-10.1021-1
44-10.1021-1
55-10.1021-1
6610.06491
7710.06491
8810.06491
99-10.1248-1

第三轮误差

返回顶部
第三轮误差

df.loc[df['y'] != df['G'], ['x']].count()
x    0
dtype: int64

总结

“三个臭皮匠抵过一个诸葛亮”,多个弱分类器(准确率大于50%)串起来(协作)能达到很好的准确度。

欢迎关注,敬请点赞!
返回顶部

这篇关于三个臭皮匠——集成学习AdaBoost简单代码实现示例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/701438

相关文章

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

Python实现微信自动锁定工具

《Python实现微信自动锁定工具》在数字化办公时代,微信已成为职场沟通的重要工具,但临时离开时忘记锁屏可能导致敏感信息泄露,下面我们就来看看如何使用Python打造一个微信自动锁定工具吧... 目录引言:当微信隐私遇到自动化守护效果展示核心功能全景图技术亮点深度解析1. 无操作检测引擎2. 微信路径智能获

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

Python中pywin32 常用窗口操作的实现

《Python中pywin32常用窗口操作的实现》本文主要介绍了Python中pywin32常用窗口操作的实现,pywin32主要的作用是供Python开发者快速调用WindowsAPI的一个... 目录获取窗口句柄获取最前端窗口句柄获取指定坐标处的窗口根据窗口的完整标题匹配获取句柄根据窗口的类别匹配获取句

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

Python位移操作和位运算的实现示例

《Python位移操作和位运算的实现示例》本文主要介绍了Python位移操作和位运算的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 位移操作1.1 左移操作 (<<)1.2 右移操作 (>>)注意事项:2. 位运算2.1

如何在 Spring Boot 中实现 FreeMarker 模板

《如何在SpringBoot中实现FreeMarker模板》FreeMarker是一种功能强大、轻量级的模板引擎,用于在Java应用中生成动态文本输出(如HTML、XML、邮件内容等),本文... 目录什么是 FreeMarker 模板?在 Spring Boot 中实现 FreeMarker 模板1. 环

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll