如何利用Python实现给Excel表格截图

2025-02-08 16:50

本文主要是介绍如何利用Python实现给Excel表格截图,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《如何利用Python实现给Excel表格截图》这篇文章主要为大家详细介绍了如何利用Python实现给Excel表格截图功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下...

我搜索了网络上的方案,感觉把 Excel 表格转换为 html 再用 platwright 截图是比China编程较顺畅的路径,因为有顺畅的工具链。如果使用的是 Windows 系统则不需要阅读此文,因为 win32com 库更方便。这篇文章中 Excel 转 HTML 的方案,主要弥补了网上其他方案中存在合并单元格的情况。代码为智谱清言帮助生成,有些变量控制还是需要自己改一下。

具体实现代码如下

 
from openpyxl import load_workbook
from openpyxl.styles import Font, Border, Side, Alignment
from playwright.sync_api import sync_playwright
from datetime import datetime
 
# 打开浏览器并截图
def capturjavascripte_table_screenshot( url, output_file, table_selector):
    with sync_playwright() as p:
        browser = p.chromium.launch(headless=False)
        page = browser.new_page()
        # 注意这里需要加协议
        page.goto("file://" + url)
        
        # 等待表格元素加载完成
        page.wait_for_selector(table_selector)
        page.wait_for_timeout(1000)
        
        # 对表格元素进行截图
        table_element = page.locator(table_selector)
        table_element.screenshot(path=output_file)
        
        browser.close()
 
# 默认合并单元格的文本内容是放在左上单元格的,如果不是,需要专门程序处理。
# 边框样式默认为1px solid
def read_excel(file_path):
    # data_only 将 Excel 表格里的公式计算成数值读取出来。
    wb = load_workbook( filename=file_path, data_only=True)
    ws = wb.active  # 读取活动工作表
    data = []
    merges = []  # 用于存储合并单元格的信息
    cell_styles = []
    
    # 读取合并单元格信息
    for merged_range in ws.merged_cells.ranges:
        start_row, start_col = merged_range.min_row, merged_range.min_col
        end_row, end_col = merged_range.max_row, merged_range.max_col
        merges.append((start_row-1, start_col-1, end_row-1, end_col-1))
 
    for row in ws.iter_rows():
        row_data = []
        row_styles = []
 
        for cell in row:
            print(f"当前单元格的坐标:{cell.coordinate}")
            if cell.coordinate in ws.merged_cells.ranges:
                # 跳过合并单元格中的非起始单元格
                continue            
            if cell.value is not None:
                print(f"单元格的值:{cell.value}")
                row_data.append(str(cell.value))                
            else:
                row_data.append('')  # 空单元格填充空字符串
            # 读取单元格样式,提供默认值
            font = cell.font if cell.font else Font()
            border = cell.border if cell.border else Border()
            alignment = cell.alignment if cell.alignment else Alignment()
 
            print(f"单元格字体颜色:{font.color.index}")
            print(f"单元格边框样式:{border.top.style}")
            cell_style = {
                'font': {
                    'name': font.name if font.name else 'Arial',
                    'size': font.size if font.size else 12,
                    'bold': font.bold if font.bold else False,
                    'italic': font.italic if font.italic else False,
                    'color': font.color.rgb if font.color and font.color.rgb else '#000000'
                },
                'border': {
                    'top': '1px solid' if border.top and border.top.style else Nonpythone,
                    'left': '1px solid' if border.left and border.left.style else None,
                    'right': '1px sowww.chinasem.cnlid' if border.right and border.right.style else None,
                    'bottom': '1px solid' if border.bottom and border.bottom.style else None
                },
                'alignment': {
                    'horizontal': alignment.horizontal if alignment.horizontal else None,
                    'vertical': alignment.vertical if alignment.vertical else None
                }
            }
            row_styles.append(cell_style)
            print(f"转换后的单元格样式:{cell_style}")
 
        data.append(row_data)
        cell_styles.append(row_styles)      
 
    return data, merges, cell_styles
 
# 该处默认只有同一行合并多列的情况。如果合并单元格占了两行,需要另外的处理。
def generate_html_table(data, merges, cell_styles):
    print(f"合并单元格的信息:{merges}")
    html = "<table style='border-collapse: collapse;'>\n"
    for row_idx, row in enumerate(data):
        print("-"*20)
        print(f"当前行的数据:{row}")
        html += "<tr>\n"
        # 设置一个跳过非首个合并单元格的标记
        skip_next_cell = 0
        for col_idx,cell in enumerate(row):
            if skip_next_cell > 0:
                skip_next_cell -= 1
                continue
            # 行号、列号从0开始
            print(f"当前单元格的值:{cell},行号:{row_idx},列号:{col_idx}")
            # 如果当前单元格为1行4列,则修改cell值
            if row_idx == 1 and col_idx == 4:
                # 获取今天的日期
                today = datetime.today()
                cell = formatted_date_no_leading_zeros = "截止 " + today.strftime("%-m 月 %-d 日")
                print(f"修改后的单元格值:{cell}")
            # 去除单元格样式
            style = cell_styles[row_idx][col_idx]
            if style:                
                font_style = f"font-family:{style['font']['name']}; font-size:{style['font']['size']}pt; " \
                            f"font-weight:{'bold' if style['font']['bold'] else 'normal'}; " \
                            f"font-style:{'italic' if style['font']['italic'] else 'normal'};"
                border_style = f"border-top:{style['border']['top']}; " \
                            f"border-left:{style['border']['left']}; " \
                            f"border-right:{style['border']['right']}; " \
                            f"border-bottom:{style['border']['bottom']};"
                alignment_style = f"text-align:{style['alignment']['horizontal']}; " \
                                f"vertical-align:{style['alignment']['vertical']};"
            
            if (row_idx, col_idx) in [(m[0], m[1]) for m in merges]:  # 检查当前单元格是否是合并单元格的起始单元格
                rowspan = [m[2] - m[0] + 1 for m in merges if m[0] == row_idx and m[1] == col_idx][0]
                colspan = [m[3] - m[1] + 1 for m in merges if m[0] == row_idx and m[1] == col_idx][0]
                if style:
                    html += f"&lChina编程t;td style='{font_style} {border_style} {alignment_style}' rowspan={rowspan} colspan={colspan}>{cell}</td>"
                else:
                    html += f"<td rowspan={rowspan} colspan={colspan}>{cell}</td>"
                skip_next_cell = colspan - 1    # 跳过合并的列
            else:
                if style:
                    html += f"<td style='{font_style} {border_style} {alignment_style}' >{cell}</td>"
                else:
                    html += f"<td>{cell}</td>"
            
        html += "</tr>\n"
    html += "</table>"
    html = "<!DOCTYPE html><html><head><meta charset='UTF-8'><title>Excel Table</title></head><body>" + html + "</body></html>"
    return html
 
def main():
    current_dir = 'reer'
    excel_file_path = current_dir + 'log/2re0207.xlsx'  # 替换为你的Excel文件路径
    html_file_path = current_dir + 'log/output.html'
    screenshot_file_path = current_dir + 'log/table_screenshot.png'
 
    data, merges, cell_styles = read_excel(excel_file_path)
    html_table = generate_html_table(data, merges, cell_styles)
    with open(html_file_path, 'w', encoding='utf-8') as file:
        file.write(html_table)
    # 调用函数,替换以下参数
    url = html_file_path  # 网页URL
    output_file = screenshot_file_path  # 输出文件路径
    table_selector = 'table'  # 表格的css选择器,根据实际情况调整
    capture_table_screenshot(url, output_file, table_selector)
        
if __name__ == "__main__":
    main()

到此这篇关于如何利用python实现给Excel表格截图的文章就介绍到这了,更多相关Python Excel截图内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!

这篇关于如何利用Python实现给Excel表格截图的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153349

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Python版本与package版本兼容性检查方法总结

《Python版本与package版本兼容性检查方法总结》:本文主要介绍Python版本与package版本兼容性检查方法的相关资料,文中提供四种检查方法,分别是pip查询、conda管理、PyP... 目录引言为什么会出现兼容性问题方法一:用 pip 官方命令查询可用版本方法二:conda 管理包环境方法