NumPy实现logistic回归

2024-09-01 15:44
文章标签 实现 logistic 回归 numpy

本文主要是介绍NumPy实现logistic回归,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.sklearn实现

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import os
import sys
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import  r2_score,confusion_matrixcurrent_dir=os.getcwd()
path = current_dir +"\\" +"BreastCancer.csv";cancer = pd.read_csv(path)cancer = cancer.drop(["id","Unnamed: 32"], axis=1)  # axis = 1, drop a column, axis = 0, drop a row
cancer['diagnosis'] = [ 1 if i == "M" else 0 for i in cancer['diagnosis'] ]y = cancer['diagnosis']                       # (569,)
x = cancer.drop(["diagnosis"], axis=1) # (569, 30)# (455, 30) (114, 30) (455,) (114,)
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0)# 标准化处理,每一列求mean和std,然后X_scaled = (x-mean)/std
# 让每一列的数据,均值为0,方差为1. 否则会内存溢出
scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train)
x_test_scaled = scaler.transform(x_test)logreg = LogisticRegression(max_iter = 1000)
logreg.fit(x_train_scaled, y_train)train_accuracy = logreg.score(x_train_scaled, y_train)  # 0.989010989010989
test_accuracy = logreg.score(x_test_scaled, y_test)     # 0.9649122807017544
print("Training Accuracy:", train_accuracy)
print("Test Accuracy:", test_accuracy)y_pred = logreg.predict(x_test_scaled)
r2 = r2_score(y_test,y_pred)         # Test R2: 0.8551921244839632
print("Test R2:", r2)print ( confusion_matrix(y_test,y_pred) )
"""
[[65  2][ 2 45]]
"""

2. NumPy实现

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd
import os
import sys
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, r2_score
from sklearn.metrics import confusion_matrixclass Logistic:def __init__(self,learning_rate = 0.01, epochs = 1000, verbose= False):self.lr = learning_rateself.epochs = epochsself.verbose = verboseself.weight = Noneself.bias = Nonedef sigmoid(self,x):z = 1 / (1 + np.exp(-x))return zdef initialise_weights(self,n):self.weight = np.zeros(n)self.bias = 0def predict_prob(self,X):linear_result = X @ self.weight + self.biasy_pred = self.sigmoid(linear_result)return y_preddef fit(self,X,y):m , n = X.shapeself.initialise_weights(n)for epoch in range(self.epochs):y_pred = self.predict_prob(X)error = (y_pred - y)dcost_dw = (1/m) * ( X.T @ error )dcost_db = (1/m) * np.sum( error )self.weight -= self.lr * dcost_dwself.bias -= self.lr * dcost_dbif self.verbose and epoch % 100 == 99:loss = (-1 / m) *np.sum(y*np.log(y_pred) + (1-y) * np.log(1-y_pred))print(f"epoch:{epoch} loss:{loss}")def predict(self,X):y_pred = self.predict_prob(X)y_pred = np.where(y_pred>=0.5,1,0)return y_predcurrent_dir=os.getcwd()
path = current_dir +"\\" +"BreastCancer.csv";cancer = pd.read_csv(path)cancer = cancer.drop(["id","Unnamed: 32"], axis=1)  # axis = 1, drop a column, axis = 0, drop a row
cancer['diagnosis'] = [ 1 if i == "M" else 0 for i in cancer['diagnosis'] ]print(cancer.shape) # (569, 31)y = cancer['diagnosis']                       # (569,)
x = cancer.drop(["diagnosis"], axis=1) # (569, 30)# (455, 30) (114, 30) (455,) (114,),类型是DataFrame
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2, random_state=0)
x_train,x_test,y_train,y_test = np.array(x_train),np.array(x_test),np.array(y_train),np.array(y_test) # 转为ndarray矩阵格式scaler = StandardScaler()
x_train_scaled = scaler.fit_transform(x_train)
x_test_scaled = scaler.transform(x_test)logistic = Logistic(learning_rate = 0.01, epochs = 1000, verbose = True)
logistic.fit(x_train_scaled,y_train)y_pred = logistic.predict(x_test_scaled)r2 = r2_score(y_test,y_pred)
print(r2)print ( confusion_matrix(y_test,y_pred) )
"""
[[65  2][ 2 45]]
"""

这篇关于NumPy实现logistic回归的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/1127366

相关文章

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

基于Python实现一个Windows Tree命令工具

《基于Python实现一个WindowsTree命令工具》今天想要在Windows平台的CMD命令终端窗口中使用像Linux下的tree命令,打印一下目录结构层级树,然而还真有tree命令,但是发现... 目录引言实现代码使用说明可用选项示例用法功能特点添加到环境变量方法一:创建批处理文件并添加到PATH1

Java使用HttpClient实现图片下载与本地保存功能

《Java使用HttpClient实现图片下载与本地保存功能》在当今数字化时代,网络资源的获取与处理已成为软件开发中的常见需求,其中,图片作为网络上最常见的资源之一,其下载与保存功能在许多应用场景中都... 目录引言一、Apache HttpClient简介二、技术栈与环境准备三、实现图片下载与保存功能1.

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

Nexus安装和启动的实现教程

《Nexus安装和启动的实现教程》:本文主要介绍Nexus安装和启动的实现教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、Nexus下载二、Nexus安装和启动三、关闭Nexus总结一、Nexus下载官方下载链接:DownloadWindows系统根

SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程

《SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程》LiteFlow是一款专注于逻辑驱动流程编排的轻量级框架,它以组件化方式快速构建和执行业务流程,有效解耦复杂业务逻辑,下面给大... 目录一、基础概念1.1 组件(Component)1.2 规则(Rule)1.3 上下文(Conte

MySQL 横向衍生表(Lateral Derived Tables)的实现

《MySQL横向衍生表(LateralDerivedTables)的实现》横向衍生表适用于在需要通过子查询获取中间结果集的场景,相对于普通衍生表,横向衍生表可以引用在其之前出现过的表名,本文就来... 目录一、横向衍生表用法示例1.1 用法示例1.2 使用建议前面我们介绍过mysql中的衍生表(From子句

Mybatis的分页实现方式

《Mybatis的分页实现方式》MyBatis的分页实现方式主要有以下几种,每种方式适用于不同的场景,且在性能、灵活性和代码侵入性上有所差异,对Mybatis的分页实现方式感兴趣的朋友一起看看吧... 目录​1. 原生 SQL 分页(物理分页)​​2. RowBounds 分页(逻辑分页)​​3. Page

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

MYSQL查询结果实现发送给客户端

《MYSQL查询结果实现发送给客户端》:本文主要介绍MYSQL查询结果实现发送给客户端方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql取数据和发数据的流程(边读边发)Sending to clientSending DataLRU(Least Rec