通过Python脚本批量复制并规范命名视频文件

2025-03-07 17:50

本文主要是介绍通过Python脚本批量复制并规范命名视频文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《通过Python脚本批量复制并规范命名视频文件》本文介绍了如何通过Python脚本批量复制并规范命名视频文件,实现自动补齐数字编号、保留原始文件、智能识别有效文件等功能,听过代码示例介绍的非常详细,...

一、问题场景:杂乱的视频文件名

在日常工作和学习中,我们经常会遇到这样的文件命名情况:

  • [1]基础教程.mp4
  • [23]进阶技巧.mp4
  • [156]项目实战.mp4

这种包含数字编号的命名方式虽然直观,但存在两个明显问题:

  • 数字位数不一致,排序时会出现顺序错乱
  • 需要修改文件名但必须保留原始文件

本文将介绍如何通过python脚本批量复制并规范命名视频文件,实现:

  • 自动补齐4位数字编号
  • 保留原始文件不修改
  • 智能识别有效文件
  • 完整复制文件属性

二、完整解决方案

import os
import re
import shutil

def rename_and_copy_mp4_files(source_dir, target_dir):
    """智能重命名并复制视频文件
    
    Args:
        source_dir (str): 源目录路径
        target_dir (str): 目标目录路径
    """
    # 创建目标目录(自动处理已存在情况)
    os.makedirs(target_dir, exist_ok=True)
    
    # 遍历源目录所有文件
    for filename in os.listdir(source_dir):
        # 使用正则表达式解析文件名
        pattern_match = re.match(r'\[(\d+)\](.+)\.(mp4|avi|mov)$', filename, re.IGphpNORECASE)
        
        if pattern_match:
            # 提取文件名组件
            file_number = pattern_match.group(1)
            file_content = pattern_match.group(2).strip()
            file_ext = pattern_match.group(3).lower()
            
            # 格式化数字编号(4位补零)
            formatted_number = file_number.zfill(4)
            
            # 构建新文件名
            new_filename = f"{formatted_number}_{file_content}.{file_ext}"
            
            # 构建完整路径
            src_path = os.path.join(source_dir, filename)
            dst_path = os.path.join(target_dir, new_filename)
            
            # 执行带元数据的复制China编程操作
            shutil.copy2(src_path, dst_path)
            print(f"成功处理:{filename} → {new_filename}")
        else:
            print(f"跳过非标准文件:{filename}")

if __name__ == "__main__":
    # 配置路径(根据实际情况修改)
    SOURCE_DIR = r"E:\video_source"
    TARGET_DIR = r"E:\video_organized"
    
    rename_and_copy_mChina编程p4_files(SOURCE_DIR, TARGET_DIR)

三、关键技术解析

1. 智能路径处理

os.makedirs(target_dir, exist_ok=True)

exist_ok=True 参数确保:

  • 目标目录不存在时自动创建
  • 目录已存在时不报错
  • 自动处理多级目录创建

2. 精准文件名匹配

r'\[(\d+)\](.+)\.(mp4|avi|mov)$'

正则表达式分解:

  • \[(\d+)\] 捕获方括号内的数字
  • (.+) 捕获任意长度内容(至少1个字符)
  • (mp4|avi|mov)$ 支持多种视频格式
  • re.IGNORECASE 忽略大小写

支持匹配的格式:

  • [123] 教程.mp4
  • [45]advanced.MOV
  • [6]测试文件.AVI

3. 数字格式化

file_number.zfill(4)

转换示例:

  • “1” → “0001”
  • “23” → “0023”
  • “156” → “0156”

4. 安全文件复制

shutil.copy2(srjsc, dst)

与普通复制的区别:

  • 保留原始创建时间
  • 保留最后修改时间
  • 保留文件权限设置
  • 保留其他元数据

四、使用指南

准备步骤

  • 安装Python 3.6+环境
  • 创建脚本文件 video_organizer.py
  • China编程备测试目录(建议先进行测试)

配置示例

# Windows系统示例
SOURCE_DIR = r"E:\training_videos"
TARGET_DIR = r"D:\sorted_videos"

# MACOS/linux示例
# SOURCE_DIR = "/Users/username/Videos/source"
# TARGET_DIR = "/Volumes/external_drive/sorted_videos"

执行效果

原始文件生成文件
[1]介绍.mp40001_介绍.mp4
[23]基础课.avi0023_基础课.avi
[156]项目实战.mov0156_项目实战.mov

五、高级扩展建议

1. 添加进度提示

# 在循环开始前添加
total_files = len([f for f in os.listdir(source_dir) if f.endswith(('.mp4', '.avi', '.mov'))])
processed = 0

# 在处理成功时添加
processed += 1
print(f"进度:{processed}/{total_files} ({processed/total_files:.1%})")

2. 防覆盖机制

if os.path.exists(dst_path):
    base, ext = os.path.splitext(new_filename)
    counter = 1
    while os.path.exists(dst_path):
        new_filename = f"{base}_{counter}{ext}"
        dst_path = os.path.join(target_dir, new_filename)
        counter += 1

3. 多线程加速

from concurrent.futures import ThreadPoolExecutor

def process_file(filename):
    # 原处理逻辑

with ThreadPoolExecutor(max_workers=4) as executor:
    executor.map(process_file, os.listdir(source_dir))

六、注意事项

  1. 路径格式验证
    • Windows路径使用反斜杠 r"E:\path"
    • 其他系统使用正斜杠 "/path/to/files"

  2. 权限问题
    • 确保对源目录有读取权限
    • 确保对目标目录有写入权限

  3. 特殊字符处理
    • 自动跳过包含非法字符的文件
    • 可添加字符过滤逻辑:

file_content = re.sub(r'[<>:"/\\|?*]', '', file_content)
  1. 性能优化
    • 万级以上文件建议添加:
    ◦ 进度条显示
    ◦ 错误日志记录
    ◦ 断点续传功能

七、总结

通过这个Python脚本,我们实现了:

  • 批量处理视频文件
  • 智能规范编号格式
  • 安全保留原始文件
  • 快速部署使用

扩展应用场景

  • 整理教学视频库
  • 规范监控录像存档
  • 管理影视素材资源
  • 自动化测试视频处理

TIP:建议将此脚本与定时任务结合,打造自动化文件管理系统。欢迎在评论区分享你的使用经验或提出改进建议!

以上就是通过Python脚本批量复制并规范命名视频文件的详细内容,更多关于Python复制并重命名视频文件的资料请关注编程China编程(www.chinasem.cn)其它相关文章!

这篇关于通过Python脚本批量复制并规范命名视频文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153674

相关文章

Python进行JSON和Excel文件转换处理指南

《Python进行JSON和Excel文件转换处理指南》在数据交换与系统集成中,JSON与Excel是两种极为常见的数据格式,本文将介绍如何使用Python实现将JSON转换为格式化的Excel文件,... 目录将 jsON 导入为格式化 Excel将 Excel 导出为结构化 JSON处理嵌套 JSON:

Python操作PDF文档的主流库使用指南

《Python操作PDF文档的主流库使用指南》PDF因其跨平台、格式固定的特性成为文档交换的标准,然而,由于其复杂的内部结构,程序化操作PDF一直是个挑战,本文主要为大家整理了Python操作PD... 目录一、 基础操作1.PyPDF2 (及其继任者 pypdf)2.PyMuPDF / fitz3.Fre

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

python中列表应用和扩展性实用详解

《python中列表应用和扩展性实用详解》文章介绍了Python列表的核心特性:有序数据集合,用[]定义,元素类型可不同,支持迭代、循环、切片,可执行增删改查、排序、推导式及嵌套操作,是常用的数据处理... 目录1、列表定义2、格式3、列表是可迭代对象4、列表的常见操作总结1、列表定义是处理一组有序项目的

python运用requests模拟浏览器发送请求过程

《python运用requests模拟浏览器发送请求过程》模拟浏览器请求可选用requests处理静态内容,selenium应对动态页面,playwright支持高级自动化,设置代理和超时参数,根据需... 目录使用requests库模拟浏览器请求使用selenium自动化浏览器操作使用playwright

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

Python极速搭建局域网文件共享服务器完整指南

《Python极速搭建局域网文件共享服务器完整指南》在办公室或家庭局域网中快速共享文件时,许多人会选择第三方工具或云存储服务,但这些方案往往存在隐私泄露风险或需要复杂配置,下面我们就来看看如何使用Py... 目录一、android基础版:HTTP文件共享的魔法命令1. 一行代码启动HTTP服务器2. 关键参

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Python获取浏览器Cookies的四种方式小结

《Python获取浏览器Cookies的四种方式小结》在进行Web应用程序测试和开发时,获取浏览器Cookies是一项重要任务,本文我们介绍四种用Python获取浏览器Cookies的方式,具有一定的... 目录什么是 Cookie?1.使用Selenium库获取浏览器Cookies2.使用浏览器开发者工具

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库