使用Python将JSON,XML和YAML数据写入Excel文件

2025-04-12 10:50

本文主要是介绍使用Python将JSON,XML和YAML数据写入Excel文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《使用Python将JSON,XML和YAML数据写入Excel文件》JSON、XML和YAML作为主流结构化数据格式,因其层次化表达能力和跨平台兼容性,已成为系统间数据交换的通用载体,本文将介绍如何...

在当今数据驱动的技术生态中,JSON、XML和YAML作为主流结构化数据格式,因其层次http://www.chinasem.cn化表达能力和跨平台兼容性,已成为系统间数据交换的通用载体。然而,当需要将这类半结构化数据转化为具备直观可视化、动态计算和协作共享特性的载体时,Excel文件因其在商业分析、科研管理和跨部门协作中的不可替代性,成为数据落地的终极界面。通过Python实现这一转换过程,不仅能突破不同数据范式间的语义鸿沟,更可构建自动化数据管道,在保留原始数据完整性的同时,赋予其动态排序、公式计算和数据透视等增值能力。本文将介绍如何使用Python导入JSON、XML和YAML格式数据到Excel文件中。

本文所使用的数据写入方法需要用到Free Spire.XLS for Python,PyPI:pip install spire.xls.free

如何使用Python写入数据到Excel工作表

我们可以使用Free Spire.XLS for Python提供的类、属性和方法来创建或载入Excel文件,并处理数据到单元格的写入以及工作表格式设置等操作。以下是操作步骤示例:

  • 创建Workbook实例以新建Excel工作簿(新建的工作簿会有三个默认工作表),或使用Workbook.LoadFromFile()方法载入已有工作簿。
  • 使用Workbook.Worksheets.get_Item()方法获取指定工作表,或使用Workbook.Worksheets.Add(sheetName: str)方法直接新建工作表。
  • 通过json、xml.etree.ElementTree和yaml组件读取相应数据。
  • 使用Worksheet.Range.get_Item()方法获取指定单元格为CellRange对象,并使用CellRange.Value属性讲数据写入单元格中。
  • 使用CellRange.BuiltInStyle、CellRange.ApplyStyle()、Worksheet.AutoFitColumn()等属性和方法,对工作表及单元格格式进行设置。
  • 使用Workbook.SaveToFile()方法保存Excel工作簿到文件。

用Python导入JSON数据到Excel工作表

JSON是一种轻量级数据交换格式,常用于Web应用中前后端数据传输。在Python中,我们可以使用标准库中的json内置组件来解析JSON文件,并提取其中数据。提取到数据之后,我们可以使用Spire.XLS for Python将其写入Excel工作表并自定义格式,完成JSON数据到Excel文件的导入。

代码示例:

# 导入所需库
from spire.xls import Workbook, FileFormat, BuiltInStyles
import json

# 读取并解析JSON订单数据
with open("E-Commerce Order Data.json", "r", encoding="utf-8") as f:
    jsonData = json.load(f)

# 定义Excel列标题
headers = ["order_id", "customer", "order_date", "status", "total", "product", "quantity", "price"]

# 将嵌套的JSON结构转换为扁平化表格数据
rows = []
for order in jsonData:
    for item in order["items"]:
        # 合并订单主数据和商品明细数据
        row = [
            order["order_id"], order["customer"], order["order_date"],
            order["status"], str(order["total"]), item["product"],
            str(item["quantity"]), str(item["price"])
        ]
        rows.append(row)python

# 初始化Excel工作簿和工作表
workbook = Workbook()
workbook.Worksheets.Clear()
sheet = workbook.Worksheets.Add("Orders")

# 写入表头到首行
for col, header in enumerate(headers):
    sheet.Range[1, col + 1].Value = header

# 写入数据行内容
for row_idx, row_data in enumerate(rows):
    for col_idx, value in enumerate(row_data):
        sheet.Range[row_idx + 2, col_idx + 1].Value = value

# 设置表格样式
sheet.Rows[0].BuiltInStyle = BuiltInStyles.Heading2  # 标题行样式
for row in range(1, sheet.Rows.Count):
    sheet.Rows[row].BuiltInStyle = BuiltInStyles.Accent2_40  # 数据行样式

# 自动调整列宽
for col in range(sheet.Columns.Count):
    sheet.AutoFitColumn(col + 1)

# 保存并释放资源
workbook.SaveToFile("output/JSONToExcel.xlsx", FileFormat.Version2016)
workbook.Dispose()

为了演示清晰,以上代码直接基于已知的字段结构进行提取。在实际项目中,建议根据具体的数据格式动态处理字段,或增加容错逻辑以应对结构变动。

JSON文件:

使用Python将JSON,XML和YAML数据写入Excel文件

输出Excel文件:

使用Python将JSON,XML和YAML数据写入Excel文件

用Python导入XML数据到Excel工作表

XML是一种js标记语言,适合表示结构复杂的数据,支持丰富的功能(如属性、注释)。同样,Python标准库也提供了xml.etree.ElementTree组件,可以帮助我们提取XML文件中的数据。我们可以使用该组件搭配Free Spire.XLS for Python来实现导入XML数据到Excel文件。

代码示例:

# 导入XML处理库和Excel操作库
import xml.etree.ElementTree as ET
from spire.xls import Workbook, FileFormat, BuiltInStyles

# 解析XML变更日志文件
tree = ET.parse("Software Manual Changelog.xml")
root = tree.getroot()

# 定义表格列标题
headers = ["version", "date", "editor", "change"]
rows = []

# 提取并转换XML数据结构
for entry in root.findall("entry"):
    # 提取公共字段
    version = entry.findtext("version", "")
    date = entry.findtext("date", "")
    editor = entry.findtext("editor", "")

    # 展开多个变更条目为独立行
    for change in entry.find("changes").findall("change"):
        rows.append([version, date, editor, change.text.strip()])

# 创建Excel工作簿
workbook = Workbook()
workbook.Worksheets.Clear()
sheet = workbook.Worksheets.Add("Changelog")

# 写入表格标题行
for col, header in enumerate(headers):
    sheet.Range[1, col + 1].Value = header

# 填充变更记录数据
for row_idx, row_data in enumerate(rows):
    for col_idx, value in enumerate(row_data):
        sheet.Range[row_idpythonx + 2, col_idx + 1].Value = value

# 应用样式模板
sheet.Rows[0].BuiltInStyle = BuiltInStyles.Heading1  # 主标题样式
for row in range(1, sheet.Rows.Count):
    sheet.Rows[row].BuiltInStyle = BuiltInStyles.Accent1_40  # 交替行底色

# 自适应列宽设置
for col in range(sheet.Columns.Count):
    sheet.AutoFitColumn(col + 1)

# 输出文件并释放资源
workbook.SaveToFile("output/XMLToExcel.xlsx", FileFormat.Version2016)
workbook.Dispose()

为了演示清晰,以上代码直接基于已知的字段结构进行提取。在实际项目中,建议根据具体的数据格式动态处理字段,或增加容错逻辑以应对结构变动。

XML文件:

使用Python将JSON,XML和YAML数据写入Excel文件

输出的Excel文件:

使用Python将JSON,XML和YAML数据写入Excel文件

用Python导入YAML数据到Excel工作表

YAML是一种简洁易读的配置文件格式,常用于DevOps和项目配置。虽然YAML通常不用于存储表格型数据,但很多结构化配置可转换成Excel表做审阅、记录或共享等,在这些实际场景中非常实用。我们可以使用Python标准库中的yaml组件处理YAML文件数据,然后将其导入Excel文件中。

代码示例:

# 导入YAML处理库和Excel操作库
import yaml
from spire.xls import Workbook, FileFormat, BuiltInStyles

# 加载CI/CD流水线配置文件
with open("CI CD Pipeline Configuration.yaml", "r", encoding="utf-8") as f:
    yaml_data = yaml.safe_load(f)  # 安全解析YAML内容

# 定义流水线分析报表列结构
headers = ["stage", "command", "output_file", "coverage", "environment"]
rows = []

# 展开流水线阶段的多维数据
for stage in yaml_data["stages"]:
    # 提取阶段基础信息
    name = stage.get("name", "")
    commands = stage.get("commands", [])
    coverage = str(stage.get("coverage", ""))  # 数值转字符串
    environment = stage.get("environment", "")
    outputs = stage.get("artifacts", []) or [""]  # 处理空输出文件情况

    # 按命令展开明细行
    for i, cmd in enumerate(commands):
        # 合并数据时保持指标数据首行展示
        row = [
            name,
            cmd,
            outputs[i] if i < len(outputs) else "",  # 匹配命令与产出文件
            coverage if i == 0 else "",  # 覆盖率仅首行保留
            environment if i == 0 else ""  # 环境信息仅首行http://www.chinasem.cn保留
        ]
        rows.append(row)

# 创建报表工作簿
workbook = Workbook()
workbook.Worksheets.Clear()
sheet = workbook.Worksheets.Add("Pipeline")

# 构建表头结构
for col, header in enumerate(headers):
    sheet.Range[1, col + 1].Value = header

# 填充动态生成的流水线数据
for row_idx, row_data in enumerate(rows):
    for col_idx, value in enumerate(row_data):
        sheet.Range[row_idx + 2, col_idx + 1].Value = str(value)  # 强制转为字符串格式

# 应用阶梯式样式方案
sheet.Rows[0].BuiltInStyle = BuiltInStyles.Heading4  # 深色渐变标题
for row in range(1, sheet.Rows.Count):
    sheet.Rows[row].BuiltInStyle = BuiltInStyles.Accent2_40  # 浅色交替行背景

# 优化列显示宽度
for col in range(sheet.Columns.Count):
    sheet.AutoFitColumn(col + 1)

# 持久化报表文件
workbook.SaveToFile("output/YAMLToExcel.xlsx", FileFormat.Version2016)
workbook.Dispose()

为了演示清晰,以上代码直接基于已知的字段结构进行提取。在实际项目中,建议根据具体的数据格式动态处理字段,或增加容错逻辑以应对结构变动。

YAML文件:

使用Python将JSON,XML和YAML数据写入Excel文件

输出的Excel文件:

使用Python将JSON,XML和YAML数据写入Excel文件

本文演示如何导入数据到Excel文件,包括JSON、XML和YAML数据到Excel工作表的导入,提供步骤介绍及代码示例。

到此这篇关于使用Python将JSON,XML和YAML数据写入Excel文件的文章就介绍到这了,更多相关Python数据写入Excel内容请搜索China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程China编程(www.chinasem.cn)!

这篇关于使用Python将JSON,XML和YAML数据写入Excel文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154192

相关文章

MySQL查询JSON数组字段包含特定字符串的方法

《MySQL查询JSON数组字段包含特定字符串的方法》在MySQL数据库中,当某个字段存储的是JSON数组,需要查询数组中包含特定字符串的记录时传统的LIKE语句无法直接使用,下面小编就为大家介绍两种... 目录问题背景解决方案对比1. 精确匹配方案(推荐)2. 模糊匹配方案参数化查询示例使用场景建议性能优

使用Python实现可恢复式多线程下载器

《使用Python实现可恢复式多线程下载器》在数字时代,大文件下载已成为日常操作,本文将手把手教你用Python打造专业级下载器,实现断点续传,多线程加速,速度限制等功能,感兴趣的小伙伴可以了解下... 目录一、智能续传:从崩溃边缘抢救进度二、多线程加速:榨干网络带宽三、速度控制:做网络的好邻居四、终端交互

Python中注释使用方法举例详解

《Python中注释使用方法举例详解》在Python编程语言中注释是必不可少的一部分,它有助于提高代码的可读性和维护性,:本文主要介绍Python中注释使用方法的相关资料,需要的朋友可以参考下... 目录一、前言二、什么是注释?示例:三、单行注释语法:以 China编程# 开头,后面的内容为注释内容示例:示例:四

Python中win32包的安装及常见用途介绍

《Python中win32包的安装及常见用途介绍》在Windows环境下,PythonWin32模块通常随Python安装包一起安装,:本文主要介绍Python中win32包的安装及常见用途的相关... 目录前言主要组件安装方法常见用途1. 操作Windows注册表2. 操作Windows服务3. 窗口操作

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

python常用的正则表达式及作用

《python常用的正则表达式及作用》正则表达式是处理字符串的强大工具,Python通过re模块提供正则表达式支持,本文给大家介绍python常用的正则表达式及作用详解,感兴趣的朋友跟随小编一起看看吧... 目录python常用正则表达式及作用基本匹配模式常用正则表达式示例常用量词边界匹配分组和捕获常用re

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

MyBatisPlus如何优化千万级数据的CRUD

《MyBatisPlus如何优化千万级数据的CRUD》最近负责的一个项目,数据库表量级破千万,每次执行CRUD都像走钢丝,稍有不慎就引起数据库报警,本文就结合这个项目的实战经验,聊聊MyBatisPl... 目录背景一、MyBATis Plus 简介二、千万级数据的挑战三、优化 CRUD 的关键策略1. 查

python实现对数据公钥加密与私钥解密

《python实现对数据公钥加密与私钥解密》这篇文章主要为大家详细介绍了如何使用python实现对数据公钥加密与私钥解密,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录公钥私钥的生成使用公钥加密使用私钥解密公钥私钥的生成这一部分,使用python生成公钥与私钥,然后保存在两个文