2024.4.17 Python爬虫复习day05 可视化

2024-04-14 23:12

本文主要是介绍2024.4.17 Python爬虫复习day05 可视化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

day05_数据可视化和程序日志

准备web服务器

注意: 记得把source资源到项目中

# 1.导包
from fastapi import FastAPI
from fastapi import Response
import uvicorn# 2.创建对象
app = FastAPI()# 3.使用对象接收浏览器请求,并且使用对象给浏览器响应资源
# 注意: get中传入请求的资源路径
@app.get('/')
def func():# 自动跳转首页with open('source/html/index.html', 'rb') as f:data = f.read()res = Response(data)return res@app.get('/{html_name}')
def func(html_name: str):# 自动跳转页面with open(f'source/html/{html_name}', 'rb') as f:data = f.read()res = Response(data)return res@app.get('/images/{img_name}')
def func(img_name: str):with open(f'source/images/{img_name}', 'rb') as f:data = f.read()res = Response(data)return res@app.get('/video/{vi_name}')
def func(vi_name: str):with open(f'source/video/{vi_name}', 'rb') as f:data = f.read()res = Response(data)return res# 4.启动服务器(指定fastapi对象,主机地址,端口号)
uvicorn.run(app,host='127.0.0.1',port=9091)

数据可视化

1.爬取数据

# 1.导包
import requests
import re# 2.准备有效的url
url = 'http://127.0.0.1:9091/gdp.html'
# 3.发送url请求,获取web服务器返回的响应对象
response = requests.get(url)
# 4.从响应对象中提取页面数据,并转为字符串类型
html_str = response.content.decode()
# print(html_str)
# 5.使用正则表达式匹配自己想要的资源
gdp_data = re.findall('<a href=""><font>(.+?)</font>.*?¥(.+?)亿元', html_str, re.S)
print(gdp_data)
# 6.数据保存(目的:为了下一次直接使用)
with open('gdp.txt', 'w', encoding='utf8') as f:f.write(str(gdp_data))

2.读取数据

# 需求: 根据之前爬取的数据进行数据可视化
# 从之前爬取数据存储文件中读出数据
with open('gdp.txt', 'r', encoding='utf8') as f:# 注意: 数据是字符串类型的data = f.read()# 把data转为列表数据也就是'[(...),(...)]' 转变为 [(...),(...)]
# 注意: eval不能随便使用,只是去除两端的引号,让里面的数据变成本身所属类型
gdp_list = eval(data)
print(gdp_list)
print(type(gdp_list))

3.pyecharts制作饼图

echarts: 百度开源的一个数据可视化工具pyecharts: python版本的echarts工具使用pyecharts步骤1.安装: pip install pyecharts2.导包: import pyecharts3.使用: 可以制作饼图,折线图,地图等可视化页面
# 0.定义函数获取要展示的数据
def get_gdp_list():# 从之前爬取数据存储文件中读出数据with open('gdp.txt', 'r', encoding='utf8') as f:# 注意: 数据是字符串类型的data = f.read()# 把data转为列表数据也就是'[(...),(...)]' 转变为 [(...),(...)]# 注意: eval不能随便使用,只是去除两端的引号,让里面的数据变成本身所属类型gdp_list = eval(data)return gdp_list# 1.导包
from pyecharts.charts import Pie
import pyecharts.options as opts# 2.创建饼图对象
pie = Pie(init_opts=opts.InitOpts(width='1500px', height='800px'))# 3.给饼图对象添加数据
# 先获取数据
gdp_list = get_gdp_list()
# 添加数据
pie.add('gdp数据',gdp_list[:10],label_opts=opts.LabelOpts(formatter='{b}:{d}%')
)
# 4.给饼图设置标题
pie.set_global_opts(title_opts=opts.TitleOpts(title='2023_GDP数据',subtitle='斌子制作'))# 5.渲染成页面
# 注意: 默认路径是当前路径下生成render.html页面
# 也可以像下面那样指定页面路径和文件名
pie.render('source/html/my_render.html')

程序日志

知识点:

python中日志模块: logging日志作用:1.查看程序的运行情况2.方便开发人员查看bug3.方便分析用户的行为和喜好日志等级: DEBUG :(数字10代表)调试信息INFO: (数字20代表)正常运行信息WARNING: (数字30代表)警告信息(默认)ERROR: (数字40代表)错误信息CRITICAL: (数字50代表)危险信息日志优先级:  DEBUG < INFO  < WARNING  < ERROR < CRITICAL

入门

# 1.导包
import logging# 2.使用
# 直接运行如下代码,观察结果: 只打印了从warning开始的三行日志信息
# 注意: 默认等级是WARNING: WARNING以及WARNING以上的信息会被打印
logging.debug('这是一个调试信息...')
logging.info('这是一个正常运行信息...')
logging.warning('这是一个警告信息...')
logging.error('这是一个错误信息...')
logging.critical('这是一个危险信息...')

格式化输出到控制台

# 1.导包
import logging# 2.使用
# 注意: 如果要修改配置,需要先修改再打印信息才会生效
# 修改日志等级
logging.basicConfig(level=logging.DEBUG,format='时间:%(asctime)s,程序名:%(filename)s,行号:%(lineno)d,%(levelname)s信息:%(message)s'
)
# 直接运行如下代码,观察结果: 只打印了从warning开始的三行日志信息
# 注意: 默认等级是WARNING: WARNING以及WARNING以上的信息会被打印
logging.debug('这是一个调试信息...')
logging.info('这是一个正常运行信息...')
logging.warning('这是一个警告信息...')
logging.error('这是一个错误信息...')
logging.critical('这是一个危险信息...')

格式化输出到文件

# 1.导包
import logging# 2.使用
# 注意: 如果要修改配置,需要先修改再打印信息才会生效
logging.basicConfig(level=logging.DEBUG,  # 修改日志等级format='时间:%(asctime)s,程序名:%(filename)s,行号:%(lineno)d,%(levelname)s信息:%(message)s',  # 格式化filename='my_log.txt',  # 指定要保存的文件名filemode='w'  # 默认模式是追加a
)
# 日志信息
logging.debug('这是一个调试信息...')
logging.info('这是一个正常运行信息...')
logging.warning('这是一个警告信息...')
logging.error('这是一个错误信息...')
logging.critical('这是一个危险信息...')

日志版本web服务器

# 1.导包
from fastapi import FastAPI
from fastapi import Response
import uvicorn
import logging# 2.创建对象
app = FastAPI()# 5.修改日志等级和输出日志到文件
# 注意: 如果要修改配置,需要先修改再打印信息才会生效
logging.basicConfig(level=logging.DEBUG,  # 修改日志等级format='时间:%(asctime)s,程序名:%(filename)s,行号:%(lineno)d,%(levelname)s信息:%(message)s',  # 格式化filename='web_log.txt',  # 指定要保存的文件名filemode='w'  # 默认模式是追加a
)# 3.使用对象接收浏览器请求,并且使用对象给浏览器响应资源
# 注意: get中传入请求的资源路径
@app.get('/')
def func():# 记录日志信息logging.info('用户访问了首页')# 自动跳转首页with open('source/html/index.html', 'rb') as f:data = f.read()res = Response(data)return res@app.get('/{html_name}')
def func(html_name: str):# 记录日志信息logging.info(f'用户访问了{html_name}资源')# 自动跳转页面with open(f'source/html/{html_name}', 'rb') as f:data = f.read()res = Response(data)return res@app.get('/images/{img_name}')
def func(img_name: str):# 记录日志信息logging.info(f'用户访问了{img_name}图片文件')# 自动跳转图片with open(f'source/images/{img_name}', 'rb') as f:data = f.read()res = Response(data)return res@app.get('/video/{vi_name}')
def func(vi_name: str):# 记录日志信息logging.info(f'用户访问了{vi_name}视频文件')# 自动返回视频资源with open(f'source/video/{vi_name}', 'rb') as f:data = f.read()res = Response(data)return res# 4.启动服务器(指定fastapi对象,主机地址,端口号)
uvicorn.run(app, host='127.0.0.1', port=9099)# 客户端通过: http://127.0.0.1:9099/ 访问

这篇关于2024.4.17 Python爬虫复习day05 可视化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/904284

相关文章

一文教你Python如何快速精准抓取网页数据

《一文教你Python如何快速精准抓取网页数据》这篇文章主要为大家详细介绍了如何利用Python实现快速精准抓取网页数据,文中的示例代码简洁易懂,具有一定的借鉴价值,有需要的小伙伴可以了解下... 目录1. 准备工作2. 基础爬虫实现3. 高级功能扩展3.1 抓取文章详情3.2 保存数据到文件4. 完整示例

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

基于Python打造一个智能单词管理神器

《基于Python打造一个智能单词管理神器》这篇文章主要为大家详细介绍了如何使用Python打造一个智能单词管理神器,从查询到导出的一站式解决,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 项目概述:为什么需要这个工具2. 环境搭建与快速入门2.1 环境要求2.2 首次运行配置3. 核心功能使用指

Python实现微信自动锁定工具

《Python实现微信自动锁定工具》在数字化办公时代,微信已成为职场沟通的重要工具,但临时离开时忘记锁屏可能导致敏感信息泄露,下面我们就来看看如何使用Python打造一个微信自动锁定工具吧... 目录引言:当微信隐私遇到自动化守护效果展示核心功能全景图技术亮点深度解析1. 无操作检测引擎2. 微信路径智能获

Python中pywin32 常用窗口操作的实现

《Python中pywin32常用窗口操作的实现》本文主要介绍了Python中pywin32常用窗口操作的实现,pywin32主要的作用是供Python开发者快速调用WindowsAPI的一个... 目录获取窗口句柄获取最前端窗口句柄获取指定坐标处的窗口根据窗口的完整标题匹配获取句柄根据窗口的类别匹配获取句

利用Python打造一个Excel记账模板

《利用Python打造一个Excel记账模板》这篇文章主要为大家详细介绍了如何使用Python打造一个超实用的Excel记账模板,可以帮助大家高效管理财务,迈向财富自由之路,感兴趣的小伙伴快跟随小编一... 目录设置预算百分比超支标红预警记账模板功能介绍基础记账预算管理可视化分析摸鱼时间理财法碎片时间利用财

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

python处理带有时区的日期和时间数据

《python处理带有时区的日期和时间数据》这篇文章主要为大家详细介绍了如何在Python中使用pytz库处理时区信息,包括获取当前UTC时间,转换为特定时区等,有需要的小伙伴可以参考一下... 目录时区基本信息python datetime使用timezonepandas处理时区数据知识延展时区基本信息

Python位移操作和位运算的实现示例

《Python位移操作和位运算的实现示例》本文主要介绍了Python位移操作和位运算的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 位移操作1.1 左移操作 (<<)1.2 右移操作 (>>)注意事项:2. 位运算2.1

使用Python和Pyecharts创建交互式地图

《使用Python和Pyecharts创建交互式地图》在数据可视化领域,创建交互式地图是一种强大的方式,可以使受众能够以引人入胜且信息丰富的方式探索地理数据,下面我们看看如何使用Python和Pyec... 目录简介Pyecharts 简介创建上海地图代码说明运行结果总结简介在数据可视化领域,创建交互式地