Python学习 Day49 Python与MySQL的交互操作 15

2023-11-30 00:18

本文主要是介绍Python学习 Day49 Python与MySQL的交互操作 15,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Python与MySQL的交互操作

案例——链家二手房数据

请求数据获取
在这里插入图片描述
数据解析
在这里插入图片描述
房名
在这里插入图片描述
房型信息
在这里插入图片描述

位置信息
在这里插入图片描述
房屋售价
在这里插入图片描述
每平单价
在这里插入图片描述
关注人数/发布时间
在这里插入图片描述
标签信息
在这里插入图片描述


MySQL中创建数据表
在这里插入图片描述

pycharm中创建SQL文件
在这里插入图片描述


具体实现代码

import requests
from bs4 import BeautifulSoup
import pymysqlclass LianJiaSpider():# 打开数据库连接db = pymysql.connect(host='localhost', port=3306, user='root', password='123456', db='test', charset='utf8')# 使用cursor()方法获取操作游标cursor = db.cursor()def __init__(self):self.url = 'http://bj.lianjia.com/ershoufang/pg{0}/' #{0}表示字符串的格式化self.heasers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'}def send_requests(self,url):'''发送请求'''resp = requests.get(url,headers=self.heasers)if resp.status_code == 200:  #判断响应状态码,200时正常返回数据return respdef parse_html(self,resp):'''解析数据'''lst = [] #用于存放数据html = resp.textbs = BeautifulSoup(html,'lxml')ul = bs.find('ul',class_='sellListContent')li_list = ul.find_all('li')#print(len(li_list))  #检查是否获取到数据for item in li_list:title = item.find('div',class_='title').text #循环获得标题的文本内容houseInfo = item.find('div',class_='houseInfo').text #获取每套房子的房型信息positionInfo = item.find('div',class_='positionInfo').text #获取每套房子的位置信息totalPrice = item.find('div',class_='totalPrice').text #获取每套房子的销售总价unitPrice = item.find('div',class_='unitPrice').text #获取每套房的单价followInfo = item.find('div',class_='followInfo') #获得每套房的关注信息if followInfo != None:           #去除空值数据followInfo = followInfo.textelse:followInfo = ''#print(title) #输出房名#print(houseInfo) #输出房型信息#print(positionInfo)  # 输出位置信息#print(totalPrice) #输出销售总价#print(unitPrice) #输出房屋单价信息#print(followInfo) #输出每套房的关注信息lst.append((title,houseInfo,positionInfo,totalPrice,unitPrice,followInfo))#print(lst)self.save(lst) #调用save函数存储数据def save(self,lst):'''存储数据'''#print(self.db) #连接成功提示:<pymysql.connections.Connection object at 0x00000249256C4E48>sql = 'insert into tb_lianjia (title,houseInfo,positionInfo,totalPrice,unitPrice,followInfo) values (%s,%s,%s,%s,%s,%s)'self.cursor.executemany(sql,lst)self.db.commit()print(self.cursor.rowcount,'插入成功')def start(self):'''启动爬虫程序'''for i in range(1,2): #当前只爬取一页数据,若为多页修改range函数范围即可full_url = self.url.format(i) #完整URL的拼接resp = self.send_requests(full_url) #拼接后发送请求#print(resp.text)self.parse_html(resp)if __name__ == '__main__':lianjia = LianJiaSpider()lianjia.start()

结果
在这里插入图片描述

这篇关于Python学习 Day49 Python与MySQL的交互操作 15的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/434880

相关文章

Python中edge-tts实现便捷语音合成

《Python中edge-tts实现便捷语音合成》edge-tts是一个功能强大的Python库,支持多种语言和声音选项,本文主要介绍了Python中edge-tts实现便捷语音合成,具有一定的参考价... 目录安装与环境设置文本转语音查找音色更改语音参数生成音频与字幕总结edge-tts 是一个功能强大的

使用Python和PaddleOCR实现图文识别的代码和步骤

《使用Python和PaddleOCR实现图文识别的代码和步骤》在当今数字化时代,图文识别技术的应用越来越广泛,如文档数字化、信息提取等,PaddleOCR是百度开源的一款强大的OCR工具包,它集成了... 目录一、引言二、环境准备2.1 安装 python2.2 安装 PaddlePaddle2.3 安装

Python+PyQt5开发一个Windows电脑启动项管理神器

《Python+PyQt5开发一个Windows电脑启动项管理神器》:本文主要介绍如何使用PyQt5开发一款颜值与功能并存的Windows启动项管理工具,不仅能查看/删除现有启动项,还能智能添加新... 目录开篇:为什么我们需要启动项管理工具功能全景图核心技术解析1. Windows注册表操作2. 启动文件

Python datetime 模块概述及应用场景

《Pythondatetime模块概述及应用场景》Python的datetime模块是标准库中用于处理日期和时间的核心模块,本文给大家介绍Pythondatetime模块概述及应用场景,感兴趣的朋... 目录一、python datetime 模块概述二、datetime 模块核心类解析三、日期时间格式化与

Linux搭建单机MySQL8.0.26版本的操作方法

《Linux搭建单机MySQL8.0.26版本的操作方法》:本文主要介绍Linux搭建单机MySQL8.0.26版本的操作方法,本文通过图文并茂的形式给大家讲解的非常详细,感兴趣的朋友一起看看吧... 目录概述环境信息数据库服务安装步骤下载前置依赖服务下载方式一:进入官网下载,并上传到宿主机中,适合离线环境

Java调用Python的四种方法小结

《Java调用Python的四种方法小结》在现代开发中,结合不同编程语言的优势往往能达到事半功倍的效果,本文将详细介绍四种在Java中调用Python的方法,并推荐一种最常用且实用的方法,希望对大家有... 目录一、在Java类中直接执行python语句二、在Java中直接调用Python脚本三、使用Run

使用Python开发Markdown兼容公式格式转换工具

《使用Python开发Markdown兼容公式格式转换工具》在技术写作中我们经常遇到公式格式问题,例如MathML无法显示,LaTeX格式错乱等,所以本文我们将使用Python开发Markdown兼容... 目录一、工具背景二、环境配置(Windows 10/11)1. 创建conda环境2. 获取XSLT

Python如何调用指定路径的模块

《Python如何调用指定路径的模块》要在Python中调用指定路径的模块,可以使用sys.path.append,importlib.util.spec_from_file_location和exe... 目录一、sys.path.append() 方法1. 方法简介2. 使用示例3. 注意事项二、imp

PyQt5+Python-docx实现一键生成测试报告

《PyQt5+Python-docx实现一键生成测试报告》作为一名测试工程师,你是否经历过手动填写测试报告的痛苦,本文将用Python的PyQt5和python-docx库,打造一款测试报告一键生成工... 目录引言工具功能亮点工具设计思路1. 界面设计:PyQt5实现数据输入2. 文档生成:python-

Python中Flask模板的使用与高级技巧详解

《Python中Flask模板的使用与高级技巧详解》在Web开发中,直接将HTML代码写在Python文件中会导致诸多问题,Flask内置了Jinja2模板引擎,完美解决了这些问题,下面我们就来看看F... 目录一、模板渲染基础1.1 为什么需要模板引擎1.2 第一个模板渲染示例1.3 模板渲染原理二、模板