13.爬虫---PyMongo安装与使用

2024-06-23 15:44
文章标签 安装 使用 爬虫 13 pymongo

本文主要是介绍13.爬虫---PyMongo安装与使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

13.PyMongo安装与使用

    • 1.安装 PyMongo
    • 2.使用PyMongo
      • 2.1连接数据库和集合
      • 2.2增加数据
      • 2.3修改数据
      • 2.4查询数据
      • 2.5删除数据
    • 3.总结

MongoDB 安装可以看这篇文章MongoDB安装配置教程(详细版)

1.安装 PyMongo

PyMongo 是Python中用于连接MongoDB数据库的库,安装起来非常简单。通常情况下,只需要在命令行中执行以下命令即可:

pip install PyMongo

如果你使用的是Python 3,可能需要使用pip3来安装:

pip3 install PyMongo

2.使用PyMongo

使用 PyMongo 连接 MongoDB 的第一步是创建一个 MongoClient 对象。可以通过以下方式创建连接

2.1连接数据库和集合

import pymongomongo = pymongo.MongoClient('localhost', 27017)
# 选择数据库
db = mongo.test
print(db)
col = db.table
print(col)

在这里插入图片描述

执行结果:

Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test')
Collection(Database(MongoClient(host=['localhost:27017'], document_class=dict, tz_aware=False, connect=True), 'test'), 'table')

2.2增加数据

插入文档可以使用 insert_one()insert_many() 方法

1.insert_one() 添加一个

# 添加
import pymongomongo = pymongo.MongoClient('localhost', 27017)
# 选择数据库
db = mongo.test
col = db.table
col.insert_one({"name": "John",'age':23}) #添加一个

执行结果:
在这里插入图片描述

2.insert_many() 添加一些

col.insert_many([{"name": "John",'age':23},{"name": "Jane",'age':24},{"name": "bob",'age':25}])

执行结果:
在这里插入图片描述

2.3修改数据

常见参数包括:

  • filter:定义了更新条件的查询对象。
  • update:包含了更新内容的对象,通常使用 $set 操作符来更新字段。
  • **kwargs:可选参数,如 upsert (在未找到匹配文档时的插入行为) 等。

更新数据可以使用 update_one()update_many() 方法:

1.update_one() 更新一个,我们更新 name=John 的 age=30

# 修改
col.update_one({"name": "John"}, {"$set": {"age": 30}})

执行结果:
在这里插入图片描述
2.update_many() 更新一些 我们更新 name=John 的 age=31

# 修改
col.update_many()({"name": "John"}, {"$set": {"age": 30}})

执行结果:
在这里插入图片描述

2.4查询数据

常见参数包括:

  • filter: 查询条件,用于指定要检索的文档。
  • projection: 投影条件,用于指定要返回的字段。
  • sort: 排序条件,用于指定返回文档的排序方式。
  • skip: 跳过的文档数量。
  • limit: 返回文档的最大数量。
  • batch_size: 每次从服务器读取的文档数量。
  • max_time_ms: 查询的最大执行时间(毫秒)。

1.查询所有

results = col.find()

执行结果:

{'_id': ObjectId('6677b7d499f1e427419c2d07'), 'name': 'John', 'age': 31}
{'_id': ObjectId('6677b91125406ce9b6fae3ea'), 'name': 'John', 'age': 31}
{'_id': ObjectId('6677b91125406ce9b6fae3eb'), 'name': 'Jane', 'age': 24}
{'_id': ObjectId('6677b91125406ce9b6fae3ec'), 'name': 'bob', 'age': 25}

2.查询 name = bob 的数据

result = col.find({'name':'bob'})
print(list(result))

执行结果:

[{'_id': ObjectId('6677b91125406ce9b6fae3ec'), 'name': 'bob', 'age': 25}]

3.使用 $gt 运算符来查询年龄大于20岁的学生,并指定返回结果中包含的字段。同时,我们指定了排序和跳过的文档数量,以及限制返回文档的数量

results = col.find({"age": {"$gt": 20}}, {"_id": 0, "name": 1, "age": 1}).sort("age", pymongo.ASCENDING).skip(1).limit(3)

执行结果:

{'name': 'bob', 'age': 25}
{'name': 'John', 'age': 31}
{'name': 'John', 'age': 31}

在这里插入图片描述

2.5删除数据

PyMongo 提供了 delete_one() delete_many() 方法来删除 MongoDB 集合中的文档

1.delete_one() 删除 name = bob 的 数据

results = col.delete_one({'name': 'bob'})
print(results)

执行结果:

DeleteResult({'n': 1, 'ok': 1.0}, acknowledged=True)

在这里插入图片描述
2.delete_many() 删除 name = John 的 数据

results = col.delete_many()({'name': 'John'})
print(results)

执行结果:

DeleteResult({'n': 2, 'ok': 1.0}, acknowledged=True)

在这里插入图片描述

3.总结

PyMongo 为 Python 程序员提供了一个强大且易于使用的 MongoDB 接口。通过上述教程,你可以学会如何安装 PyMongo、连接 MongoDB、创建数据库和集合、插入和查询文档、更新和删除数据,以及如何对结果进行排序、跳过和限制。这些操作构成了与 MongoDB 数据库交互的基础。

这篇关于13.爬虫---PyMongo安装与使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1087581

相关文章

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

Win10安装Maven与环境变量配置过程

《Win10安装Maven与环境变量配置过程》本文介绍Maven的安装与配置方法,涵盖下载、环境变量设置、本地仓库及镜像配置,指导如何在IDEA中正确配置Maven,适用于Java及其他语言项目的构建... 目录Maven 是什么?一、下载二、安装三、配置环境四、验证测试五、配置本地仓库六、配置国内镜像地址

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

使用Python构建智能BAT文件生成器的完美解决方案

《使用Python构建智能BAT文件生成器的完美解决方案》这篇文章主要为大家详细介绍了如何使用wxPython构建一个智能的BAT文件生成器,它不仅能够为Python脚本生成启动脚本,还提供了完整的文... 目录引言运行效果图项目背景与需求分析核心需求技术选型核心功能实现1. 数据库设计2. 界面布局设计3

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符