JSON数据处理利器——Python JSONPath库详解

2024-04-15 22:04

本文主要是介绍JSON数据处理利器——Python JSONPath库详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

🍀 前言

博客地址:

  • CSDN:https://blog.csdn.net/powerbiubiu

👋 简介

JsonPath 是一种信息抽取类库,是从JSON文档中抽取指定信息的工具,提供多种语言实现版本,包括:Javascript、Python、PHP 和 Java。本文介绍Python中JsonPath模块的运用。

📖 正文

1 JSONPath的安装

pip install jsonpath -i https://pypi.tuna.tsinghua.edu.cn/simple

2 JSONPath的语法

JSONPath描述
$表示根元素
@当前元素
. 或者 []子元素
递归下降,JSONPath是从E4X借鉴的
*通配符,所有对象/元素
[,]连接操作符在XPath 结果合并其它结点集合。JSONP允许name或者数组索引
[start🔚step]数组分割操作从ES4借鉴
?()应用过滤表达式
()脚本表达式,使用底层脚本引擎

3 测试数据准备

data = {# 百货商店"store": {"books": [{# 书籍名称"title": "Python编程入门指南",# 书籍作者"author": "John Smith",# 发布日期"publication_date": "2022-01-01",# 书籍编号"isbn": "978-1-234567-89-0",# 出版商"publisher": "ABC Publishing",# 价格"price": 29.99},{"title": "JavaScript高级编程","author": "Emily Johnson","publication_date": "2021-09-15","isbn": "978-9-876543-21-0","publisher": "XYZ Books","price": 39.99},{"title": "数据结构与算法导论","author": "David Chen","publication_date": "2020-05-10","isbn": "978-6-789012-34-5","publisher": "DEF Publications","price": 49.99}],"pens": [{# 品牌"brand": "Pilot",# 模型"model": "G2",# 颜色"ink_color": "Blue",# 尺寸"tip_size_mm": 0.7,# 价格"price": 2.99}]}
}

4 JSONPath的使用

4.1 获取所有商品信息

包含商品名称,表达式等价 $.*

store = jsonpath.jsonpath(data, '$.store')
print(store)# [{'books': [{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}, {'title': 'JavaScript高级编程', 'author': 'Emily Johnson', 'publication_date': '2021-09-15', 'isbn': '978-9-876543-21-0', 'publisher': 'XYZ Books', 'price': 39.99}, {'title': '数据结构与算法导论', 'author': 'David Chen', 'publication_date': '2020-05-10', 'isbn': '978-6-789012-34-5', 'publisher': 'DEF Publications', 'price': 49.99}], 'pens': [{'brand': 'Pilot', 'model': 'G2', 'ink_color': 'Blue', 'tip_size_mm': 0.7, 'price': 2.99}, {'brand': 'Uni-ball', 'model': 'Signo 207', 'ink_color': 'Black', 'tip_size_mm': 0.5, 'price': 3.49}, {'brand': 'Zebra', 'model': 'Sarasa', 'ink_color': 'Red', 'tip_size_mm': 0.7, 'price': 2.79}]}]

不包含商品名称

store = jsonpath.jsonpath(data, '$.store.*')
print(store)# [[{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}, {'title': 'JavaScript高级编程', 'author': 'Emily Johnson', 'publication_date': '2021-09-15', 'isbn': '978-9-876543-21-0', 'publisher': 'XYZ Books', 'price': 39.99}, {'title': '数据结构与算法导论', 'author': 'David Chen', 'publication_date': '2020-05-10', 'isbn': '978-6-789012-34-5', 'publisher': 'DEF Publications', 'price': 49.99}], [{'brand': 'Pilot', 'model': 'G2', 'ink_color': 'Blue', 'tip_size_mm': 0.7, 'price': 2.99}, {'brand': 'Uni-ball', 'model': 'Signo 207', 'ink_color': 'Black', 'tip_size_mm': 0.5, 'price': 3.49}, {'brand': 'Zebra', 'model': 'Sarasa', 'ink_color': 'Red', 'tip_size_mm': 0.7, 'price': 2.79}]]
4.2 获取所有书籍信息
res = jsonpath.jsonpath(data,'$.store.books')
print(res)# [[{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}, {'title': 'JavaScript高级编程', 'author': 'Emily Johnson', 'publication_date': '2021-09-15', 'isbn': '978-9-876543-21-0', 'publisher': 'XYZ Books', 'price': 39.99}, {'title': '数据结构与算法导论', 'author': 'David Chen', 'publication_date': '2020-05-10', 'isbn': '978-6-789012-34-5', 'publisher': 'DEF Publications', 'price': 49.99}]]
4.3 获取所有书籍名称
# 方式一
res1 = jsonpath.jsonpath(data,'$.store.books[*].title')
print(res1)
# 方式二
res2 = jsonpath.jsonpath(data, '$..title')
print(res2)# ['Python编程入门指南', 'JavaScript高级编程', '数据结构与算法导论']
# ['Python编程入门指南', 'JavaScript高级编程', '数据结构与算法导论']
4.4 获取第一本书籍的信息
res = jsonpath.jsonpath(data, '$.store.books[0]')
print(res)# [{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}]
4.5 获取最后一本书籍的信息
res = jsonpath.jsonpath(data, '$.store.books[(@.length-1)]')
print(res)# [{'title': '数据结构与算法导论', 'author': 'David Chen', 'publication_date': '2020-05-10', 'isbn': '978-6-789012-34-5', 'publisher': 'DEF Publications', 'price': 49.99}]
4.6 获取前两本书籍的信息

表达式等价 . s t o r e . b o o k s [ 0 , 1 ] , .store.books[0,1], .store.books[0,1].store.books[:2]

# 获取前面的两本书
res = jsonpath.jsonpath(data, '$..books[0,1]') 
print(res)# [{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}, {'title': 'JavaScript高级编程', 'author': 'Emily Johnson', 'publication_date': '2021-09-15', 'isbn': '978-9-876543-21-0', 'publisher': 'XYZ Books', 'price': 39.99}]
4.7 获取第一本书籍的作者
res = jsonpath.jsonpath(data,'$.store.books[0].author')
print(res)# ['John Smith']

Tips:
当前书籍只有3本,所以索引取值为[0,1,2],如果索引越界,返回的结果为false

4.8 获取所有商品的价格

会把store中所有商品(books,pens)的价格都获取出来

res = jsonpath.jsonpath(data, '$.store.*..price')
print(res)# [29.99, 39.99, 49.99, 2.99, 3.49, 2.79]
4.9 过滤有编号的书籍
res = jsonpath.jsonpath(data, '$..books[?(@.isbn)]')
print(res)# [{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}, {'title': 'JavaScript高级编程', 'author': 'Emily Johnson', 'publication_date': '2021-09-15', 'isbn': '978-9-876543-21-0', 'publisher': 'XYZ Books', 'price': 39.99}, {'title': '数据结构与算法导论', 'author': 'David Chen', 'publication_date': '2020-05-10', 'isbn': '978-6-789012-34-5', 'publisher': 'DEF Publications', 'price': 49.99}]
4.10 过滤价格大于40的书籍
res = jsonpath.jsonpath(data, '$..books[?(@.price>40)]')
print(res)# [{'title': '数据结构与算法导论', 'author': 'David Chen', 'publication_date': '2020-05-10', 'isbn': '978-6-789012-34-5', 'publisher': 'DEF Publications', 'price': 49.99}]
4.11 过滤书籍名称包含Python的书籍
res = jsonpath.jsonpath(data, '$..books[?("Python" in @.title)]')
print(res)# [{'title': 'Python编程入门指南', 'author': 'John Smith', 'publication_date': '2022-01-01', 'isbn': '978-1-234567-89-0', 'publisher': 'ABC Publishing', 'price': 29.99}]

💖 欢迎关注我的公众号

在这里插入图片描述

这篇关于JSON数据处理利器——Python JSONPath库详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/907050

相关文章

C#特性(Attributes)和反射(Reflection)详解

《C#特性(Attributes)和反射(Reflection)详解》:本文主要介绍C#特性(Attributes)和反射(Reflection),具有很好的参考价值,希望对大家有所帮助,如有错误... 目录特性特性的定义概念目的反射定义概念目的反射的主要功能包括使用反射的基本步骤特性和反射的关系总结特性

Python文件操作与IO流的使用方式

《Python文件操作与IO流的使用方式》:本文主要介绍Python文件操作与IO流的使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、python文件操作基础1. 打开文件2. 关闭文件二、文件读写操作1.www.chinasem.cn 读取文件2. 写

详解如何在SpringBoot控制器中处理用户数据

《详解如何在SpringBoot控制器中处理用户数据》在SpringBoot应用开发中,控制器(Controller)扮演着至关重要的角色,它负责接收用户请求、处理数据并返回响应,本文将深入浅出地讲解... 目录一、获取请求参数1.1 获取查询参数1.2 获取路径参数二、处理表单提交2.1 处理表单数据三、

PyQt6中QMainWindow组件的使用详解

《PyQt6中QMainWindow组件的使用详解》QMainWindow是PyQt6中用于构建桌面应用程序的基础组件,本文主要介绍了PyQt6中QMainWindow组件的使用,具有一定的参考价值,... 目录1. QMainWindow 组php件概述2. 使用 QMainWindow3. QMainW

使用Python自动化生成PPT并结合LLM生成内容的代码解析

《使用Python自动化生成PPT并结合LLM生成内容的代码解析》PowerPoint是常用的文档工具,但手动设计和排版耗时耗力,本文将展示如何通过Python自动化提取PPT样式并生成新PPT,同时... 目录核心代码解析1. 提取 PPT 样式到 jsON关键步骤:代码片段:2. 应用 JSON 样式到

python通过curl实现访问deepseek的API

《python通过curl实现访问deepseek的API》这篇文章主要为大家详细介绍了python如何通过curl实现访问deepseek的API,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编... API申请和充值下面是deepeek的API网站https://platform.deepsee

MySQL中SQL的执行顺序详解

《MySQL中SQL的执行顺序详解》:本文主要介绍MySQL中SQL的执行顺序,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录mysql中SQL的执行顺序SQL执行顺序MySQL的执行顺序SELECT语句定义SELECT语句执行顺序总结MySQL中SQL的执行顺序

Java资源管理和引用体系的使用详解

《Java资源管理和引用体系的使用详解》:本文主要介绍Java资源管理和引用体系的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、Java的引用体系1、强引用 (Strong Reference)2、软引用 (Soft Reference)3、弱引用 (W

C语言中的常见进制转换详解(从二进制到十六进制)

《C语言中的常见进制转换详解(从二进制到十六进制)》进制转换是计算机编程中的一个常见任务,特别是在处理低级别的数据操作时,C语言作为一门底层编程语言,在进制转换方面提供了灵活的操作方式,今天,我们将深... 目录1、进制基础2、C语言中的进制转换2.1 从十进制转换为其他进制十进制转二进制十进制转八进制十进

Python Selenium动态渲染页面和抓取的使用指南

《PythonSelenium动态渲染页面和抓取的使用指南》在Web数据采集领域,动态渲染页面已成为现代网站的主流形式,本文将从技术原理,环境配置,核心功能系统讲解Selenium在Python动态... 目录一、Selenium技术架构解析二、环境搭建与基础配置1. 组件安装2. 驱动配置3. 基础操作模