AI办公自动化:批量合并多个Excel表格的数据并汇总

2024-06-14 08:52

本文主要是介绍AI办公自动化:批量合并多个Excel表格的数据并汇总,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

工作任务:

有多个表格

把里面的月流量数据都合并到一张表中:

在chatgpt中输入提示词:

你是一个Python编程专家,要完成一个Python脚本编写任务,具体步骤如下:

打开文件夹:F:\AI自媒体内容\AI行业数据分析\toolify月榜

逐个读取文件夹里面的xlsx表格文件;

读取xlsx表格文件的主文件名,设为变量{biaoge},提取主文件名中”toolify”和”排行榜”之间的内容,设为变量{date};

读取"F:\AI自媒体内容\AI行业数据分析\toolify月榜\新建文件夹\toolify2023年-2024年月排行榜汇总数据.xlsx"

将{date}写入"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格文件的C列表头;

将{biaoge}这个表格中D列“name”里面单元格的内容和"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格的B列“name”进行对比,如果一致,就将{biaoge}这个表格中E列“month_visited_count”里面单元格的内容复制到"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格的C列;

数据比对完成后,继续下一个表格(比对数据写入"toolify2023年-2024年月排行榜汇总数据.xlsx"这个表格的D列),直到文件夹中19个表格都比对完成;

注意:每一步都要输出信息到屏幕

源代码:

import pandas as pd

import os

import re

# 定义文件夹路径

folder_path = r'F:\AI自媒体内容\AI行业数据分析\toolify月榜'

summary_file_path = os.path.join(folder_path, '新建文件夹', 'toolify2023年-2024年月排行榜汇总数据.xlsx')

# 读取汇总文件

summary_df = pd.read_excel(summary_file_path)

# 逐个读取文件夹中的xlsx文件

files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 处理每个xlsx文件

for file in files:

file_path = os.path.join(folder_path, file)

# 提取日期

match = re.search(r'toolify(.*?)排行榜', file)

if match:

date = match.group(1)

print(f'Processing file: {file}, Extracted date: {date}')

else:

print(f'No valid date found in filename: {file}')

continue

# 读取当前文件

df = pd.read_excel(file_path)

# 将date添加到summary_df中

if date not in summary_df.columns:

summary_df[date] = None

# 比对并复制数据

for index, row in summary_df.iterrows():

name = row['name']

match_row = df[df['name'] == name]

if not match_row.empty:

summary_df.at[index, date] = match_row.iloc[0]['month_visited_count']

print(f'Updated summary for {name} with {match_row.iloc[0]["month_visited_count"]}')

# 保存结果

summary_df.to_excel(summary_file_path, index=False)

print(f'Summary file updated at: {summary_file_path}')

这篇关于AI办公自动化:批量合并多个Excel表格的数据并汇总的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1059945

相关文章

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

使用jenv工具管理多个JDK版本的方法步骤

《使用jenv工具管理多个JDK版本的方法步骤》jenv是一个开源的Java环境管理工具,旨在帮助开发者在同一台机器上轻松管理和切换多个Java版本,:本文主要介绍使用jenv工具管理多个JD... 目录一、jenv到底是干啥的?二、jenv的核心功能(一)管理多个Java版本(二)支持插件扩展(三)环境隔

使用SpringBoot整合Sharding Sphere实现数据脱敏的示例

《使用SpringBoot整合ShardingSphere实现数据脱敏的示例》ApacheShardingSphere数据脱敏模块,通过SQL拦截与改写实现敏感信息加密存储,解决手动处理繁琐及系统改... 目录痛点一:痛点二:脱敏配置Quick Start——Spring 显示配置:1.引入依赖2.创建脱敏

Linux实现线程同步的多种方式汇总

《Linux实现线程同步的多种方式汇总》本文详细介绍了Linux下线程同步的多种方法,包括互斥锁、自旋锁、信号量以及它们的使用示例,通过这些同步机制,可以解决线程安全问题,防止资源竞争导致的错误,示例... 目录什么是线程同步?一、互斥锁(单人洗手间规则)适用场景:特点:二、条件变量(咖啡厅取餐系统)工作流

C#实现将Office文档(Word/Excel/PDF/PPT)转为Markdown格式

《C#实现将Office文档(Word/Excel/PDF/PPT)转为Markdown格式》Markdown凭借简洁的语法、优良的可读性,以及对版本控制系统的高度兼容性,逐渐成为最受欢迎的文档格式... 目录为什么要将文档转换为 Markdown 格式使用工具将 Word 文档转换为 Markdown(.

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=