黑马程序员Python机器学习|1机器学习概述

2024-08-30 09:20

本文主要是介绍黑马程序员Python机器学习|1机器学习概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一 人工智能概述

 1.什么是人工智能

2.机器学习和人工智能,深度学习的关系

 

  机器学习的目的:用机器来模仿人类学习以及其他方面的智能。

 

数据库存储历史数据(离线数据),数据挖掘建立在过去数据的基础上,找数据的关联,数据挖掘需要统计分析技术处理数据,模式是行为,大数据最早应用在模式识别上,使用人工智和数据挖掘能做信用卡欺诈的识别。每年收入只有十万,但是信用卡里有一百万,就不能拿这一百万去买房子。因为没有偿还能力。不许在短时期内刷出一百万。突击刷出一百万。短期刷出还款极限的金额。信用卡欺诈罪。

神经计算是神经网络,属于深度学习。人工智能包括机器学习和深度学习,人工智能不等于机器学习,神经网络不等于神经计算。


二 什么是机器学习

1.机器学习的定义

机器学习是实现人工智能的途径,模仿人的一些功能。 

学习:训练。

 

从数据中学习,学习后得出的结论是模型(规律),通过这个规律去解决问题(做预测)。

3.数据集的构成

数据集:要学习的数据。

目标值:房屋价格。(预测的结果)

房屋的各个属性:特征值(4个)

一个班级里的人,并没有特别安排,但是过几天就会各种小团体,物以类聚,人以群分。没有目标值,但是也可以分成一堆一堆的,根据特征相近就分成一个堆。这就是没有目标值。

4.机器学习的分类

监督学习

A 分类问题

特征值:这些图片。

目标值:是猫还是狗。(类别)

把目标值是类别的问题叫做分类问题。

数据里面有特征值和目标值,并且目标值是一个分类,这就是分类问题。

目标值是离散型数据。

B 回归问题 

有特征值和目标值,特征值是面积,朝向等,目标值是房屋的价格。(具体的值)

目标值是连续型数据。属于回归问题。

 

无监督学习

无目标值的属于无监督学习。

 

 5.机器学习可以做什么

智能客服。 

计算机视觉更多的是深度学习。

推荐系统。

强化学习。

6.机器学习和数据挖掘的关系

7.机器学习三要素

训练过程到底按照什么样的准则去学习或者选择?这个准则就是学习策略。 

学习策略比如宁可错杀也不放过的思想。

8.机器学习算法的分类

在线学习(实时学习):指每次接受一个样本,进行预测,之后学习模型,并不断重复该操作的机器学习。有些实际应用场景要求学习必须是在线的,实时推荐。

批量学习(离线学习):一次接受所有数据,学习模型,之后预测。

1、 模型训练过程低效 2、 训练过程不易拓展于大数据场景。 3、 模型无法适应动态变化的环境。



三 机器学习开发流程

获取数据,对数据处理(数据预处理),特征工程(数据处理,处理成能被算法使用的数据,特征值),选择合适算法进行训练得到模型(机器学习),进行模型评估(评估不好就要返回到数据预处理循环,直到模型应用,要用数据对模型进行评估)



四 学习框架和资料介绍

1.明确问题

算法的改进,也要有数据的积累,有大量的数据,再用算法进行训练,数据量大要进行训练也很消耗计算机,对计算机的要求也比较高。

确定在开发过程中定位到哪个方向。

2.大学的学习步骤:

库和框架,算法底层怎么实现的,怎么实例化的。

应用

3.建议学习方法

从实际例子入手是入门快的方法,分析问题,使用机器学习算法解决一些简单的任务。

先学会用库和框架解决问题。用别人有的工具来造轮子。

A 入门,知道是干什么的,可以实现怎样的效果,有了自学能力。

B 知道往哪个方向发展后,可以看实战类书籍。

C 为什么这个算法效果这么好,背后用到了什么,数学原理是什么,就可以看理论书。

这篇关于黑马程序员Python机器学习|1机器学习概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1120416

相关文章

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

Python操作PDF文档的主流库使用指南

《Python操作PDF文档的主流库使用指南》PDF因其跨平台、格式固定的特性成为文档交换的标准,然而,由于其复杂的内部结构,程序化操作PDF一直是个挑战,本文主要为大家整理了Python操作PD... 目录一、 基础操作1.PyPDF2 (及其继任者 pypdf)2.PyMuPDF / fitz3.Fre

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统