openxml获取sheet所有的数据二维数组

2024-01-16 23:20

本文主要是介绍openxml获取sheet所有的数据二维数组,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

此代码假定您已经安装了OpenXML SDK,并且您有一个.xlsx文件的路径。\n\n请注意,续写的代码将获取指定工作表中的所有数据,包括空单元格,并将它们存储在一个二维数组中。如果工作表中有多个行和列,数组的大小将与工作表中的行数和列数相匹配。\n\n```csharp\nusing DocumentFormat.OpenXml.Packaging;\nusing DocumentFormat.OpenXml.Spreadsheet;\nusing System;\nusing System.Collections.Generic;\nusing System.Linq;\n\npublic class ExcelReader\n{\n    public static string[,] GetAllSheetData(string filePath, string sheetName)\n    {\n        // 打开Excel文件\n        using (SpreadsheetDocument document = SpreadsheetDocument.Open(filePath, false))\n        {\n            // 获取工作表\n            WorkbookPart workbookPart = document.WorkbookPart;\n            Sheet sheet = workbookPart.Workbook.Descendants<Sheet>().FirstOrDefault(s => s.Name == sheetName);\n            if (sheet == null)\n            {\n                throw new ArgumentException($\"Sheet {sheetName} not found.\", nameof(sheetName));\n            }\n\n            // 获取工作表数据\n            WorksheetPart worksheetPart = (WorksheetPart)workbookPart.GetPartById(sheet.Id);\n            SheetData sheetData = worksheetPart.Worksheet.Elements<SheetData>().First();\n            var rows = sheetData.Descendants<Row>();\n\n            // 获取最大行数和列数\n            int rowCount = rows.Count();\n            int colCount = rows.Max(r => r.Elements<Cell>().Count());\n\n            // 创建二维数组\n            string[,] dataArray = new string[rowCount, colCount];\n\n            // 遍历所有行\n            for (int i = 0; i < rowCount; i++)\n            {\n                var row = rows.ElementAt(i);\n                var cells = row.Elements<Cell>().ToArray();\n\n                // 遍历所有列\n                for (int j = 0; j < colCount; j++)\n                {\n                    // 如果单元格不存在,则将其视为空\n                    if (j >= cells.Length || cells[j].CellValue == null)\n                    {\n                        dataArray[i, j] = string.Empty;\n                    }\n                    else\n                    {\n                        string value = cells[j].CellValue.InnerText;\n\n                        // 假设值是一个共享字符串\n                        if (cells[j].DataType != null && cells[j].DataType.Value == CellValues.SharedString)\n                        {\n                            var stringTable = workbookPart.GetPartsOfType<SharedStringTablePart>().FirstOrDefault();\n                            if (stringTable != null)\n                            {\n                                value = stringTable.SharedStringTable.ElementAt(int.Parse(value)).InnerText;\n                            }\n                        }\n                        dataArray[i, j] = value;\n                    }\n                }\n            }\n            return dataArray;\n        }\n    }\n}\n```\n\n在这段代码中,我们首先使用`SpreadsheetDocument.Open`方法打开Excel文件。然后,我们查找具有指定名称的工作表,并获取工作表中的所有行和列。我们计算出最大的行数和列数,以便创建一个适当大小的二维字符串数组。接着,我们遍历所有的行和列,将每个单元格的数据读取到数组中。\n\n如果单元格的数据是共享字符串(即,字符串存在于工作簿的共享字符串表中),我们会检索共享字符串表并获取实际的字符串值。\n\n现在,您可以通过调用`ExcelReader.GetAllSheetData`方法并传递Excel文件的路径和工作表的名称来获取工作表中的所有数据。

using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Spreadsheet;
using System;
using System.Collections.Generic;
using System.Linq;class Program
{static void Main(){string filePath = "YourExcelFile.xlsx"; // 替换为您的Excel文件路径// 调用方法获取工作表数据string[][] sheetData = ReadExcelFile(filePath, "Sheet1");// 打印数据foreach (var row in sheetData){Console.WriteLine(string.Join("\t", row));}}static string[][] ReadExcelFile(string filePath, string sheetName){List<string[]> sheetData = new List<string[]>();using (SpreadsheetDocument spreadsheetDocument = SpreadsheetDocument.Open(filePath, false)){WorkbookPart workbookPart = spreadsheetDocument.WorkbookPart;Sheet sheet = workbookPart.Workbook.Descendants<Sheet>().FirstOrDefault(s => s.Name == sheetName);if (sheet != null){WorksheetPart worksheetPart = (WorksheetPart)workbookPart.GetPartById(sheet.Id);// 获取工作表中的所有行IEnumerable<Row> rows = worksheetPart.Worksheet.Descendants<Row>();foreach (Row row in rows){// 获取行中的所有单元格IEnumerable<Cell> cells = row.Elements<Cell>();// 将单元格值添加到数组string[] rowData = cells.Select(cell => GetCellValue(workbookPart, cell)).ToArray();sheetData.Add(rowData);}}}return sheetData.ToArray();}static string GetCellValue(WorkbookPart workbookPart, Cell cell){if (cell.DataType != null && cell.DataType == CellValues.SharedString){// 如果单元格类型为共享字符串,则获取共享字符串的值SharedStringTablePart sharedStringTablePart = workbookPart.GetPartsOfType<SharedStringTablePart>().FirstOrDefault();if (sharedStringTablePart != null){int sharedStringIndex = int.Parse(cell.InnerText);return sharedStringTablePart.SharedStringTable.Elements<SharedStringItem>().ElementAt(sharedStringIndex).InnerText;}}// 否则直接获取单元格的值return cell.InnerText;}
}

这篇关于openxml获取sheet所有的数据二维数组的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/614247

相关文章

使用Python实现获取屏幕像素颜色值

《使用Python实现获取屏幕像素颜色值》这篇文章主要为大家详细介绍了如何使用Python实现获取屏幕像素颜色值,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 一、一个小工具,按住F10键,颜色值会跟着显示。完整代码import tkinter as tkimport pyau

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

python获取cmd环境变量值的实现代码

《python获取cmd环境变量值的实现代码》:本文主要介绍在Python中获取命令行(cmd)环境变量的值,可以使用标准库中的os模块,需要的朋友可以参考下... 前言全局说明在执行py过程中,总要使用到系统环境变量一、说明1.1 环境:Windows 11 家庭版 24H2 26100.4061

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创