【教程】英文字幕批量翻译

2024-05-12 23:44

本文主要是介绍【教程】英文字幕批量翻译,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文介绍批量翻译英文字幕的方法

文章目录

  • 1、字幕翻译工具ANTO
  • 2、导出内封的字幕文件
    • 2.1 ffmpeg的安装
    • 2.2 字幕提取
    • 2.3 字幕两行调增为一行
  • 3、字幕翻译

1、字幕翻译工具ANTO

字幕翻译工具ANTO

下载链接:https://github.com/speauty/anto/releases

感谢github作者speauty的贡献

本工具可以直接对srt字幕文件进行单个或批量翻译

2、导出内封的字幕文件

有的字幕文件是内嵌在视频文件中的,即MP4文件中包含了srt字幕文件,这时需要使用ffmpeg工具提取出字幕文件

2.1 ffmpeg的安装

ffmpeg的安装参考文章FFmpeg详细安装步骤和使用笔记,在此感谢博主瞿同学(Darren)的贡献

2.2 字幕提取

修改自己的视频文件夹的路径,运行后即可提取出srt字幕文件,由于ffmpeg提取的时候会添加上默认的字体格式、大小,代码中也写了相应的语句进行删除,即保存的srt字幕为纯文本格式

import os
import subprocess
import re
# 设置视频文件夹路径
video_folder = "D:\your_videos_folder"
# 遍历视频文件夹中的所有文件
for filename in os.listdir(video_folder):# 检查文件是否是视频文件(这里简单地通过文件扩展名来判断)if filename.endswith((".mp4", ".avi", ".mkv")):# 构建视频文件路径video_path = os.path.join(video_folder, filename)# 构建字幕文件路径,保持与视频文件名一致,但扩展名为srtsubtitle_path = os.path.splitext(video_path)[0] + ".srt"# 运行FFmpeg命令来提取字幕ffmpeg_cmd = ['ffmpeg', '-i', video_path, '-map', '0:s:0', subtitle_path]subprocess.run(ffmpeg_cmd)print(f"Extracted subtitles for {filename}")# 处理生成的字幕文件,删除<font>标签with open(subtitle_path, 'r', encoding='utf-8') as file:subtitle_content = file.read()# 使用正则表达式删除<font>标签clean_subtitle_content = re.sub(r'<font face="Serif" size="18">|</font>', '', subtitle_content)# 写回到字幕文件中with open(subtitle_path, 'w', encoding='utf-8') as file:file.write(clean_subtitle_content)print(f"Cleaned subtitles for {filename}")

2.3 字幕两行调增为一行

在使用翻译工具ANTO进行翻译的时候我发现,如果字幕存在换行的情况,则翻译会失效,下方代码可以将字幕文件中存在换行的部分调整到一行

import os
# 设置字幕文件夹路径
subtitle_folder = "D:\your_srt_folder"
# 遍历字幕文件夹中的所有字幕文件
for filename in os.listdir(subtitle_folder):if filename.endswith('.srt'):subtitle_path = os.path.join(subtitle_folder, filename)# 读取原始字幕文件内容with open(subtitle_path, 'r', encoding='utf-8') as f:subtitle_content = f.readlines()# 调整字幕格式并保存new_subtitle_content = []current_sub = ""for line in subtitle_content:line = line.strip()if line == "":# 如果是空行,直接添加到新的字幕内容中# new_subtitle_content.append(line)passelif line.isdigit():# 如果是字幕序号行,直接添加到新的字幕内容中if current_sub:new_subtitle_content.append(current_sub)current_sub = ""new_subtitle_content.append(line)elif '-->' in line:# 如果是时间轴行,直接添加到新的字幕内容中new_subtitle_content.append(line)else:# 如果是字幕内容行,将内容添加到当前字幕中current_sub += line + " "# 添加最后一个字幕if current_sub:new_subtitle_content.append(current_sub)# 写入新的字幕文件new_subtitle_path = os.path.splitext(subtitle_path)[0] + "_adjusted.srt"with open(new_subtitle_path, 'w', encoding='utf-8') as f:f.write('\n'.join(new_subtitle_content))print(f"Adjusted subtitles for {filename} saved to {new_subtitle_path}")

调整后,会删除掉原来的空白行,标准的字幕文件每个时间戳之间会有空行,下方的代码实现添加空行

import os
# 设置字幕文件夹路径
subtitle_folder = "D:\your_adjusted_srt_folder"
# 遍历字幕文件夹中的所有字幕文件
for filename in os.listdir(subtitle_folder):if filename.endswith('.srt'):subtitle_path = os.path.join(subtitle_folder, filename)# 读取原始字幕文件内容with open(subtitle_path, 'r', encoding='utf-8') as f:subtitle_content = f.readlines()# 在每一句字幕的下方增加一个空白行new_subtitle_content = []for line in subtitle_content:new_subtitle_content.append(line.strip())# 如果是空行或者时间轴行,则不添加空白行if line.strip() and not line.strip().isdigit() and '-->' not in line:new_subtitle_content.append('')  # 添加一个空白行# 写入新的字幕文件new_subtitle_path = os.path.splitext(subtitle_path)[0] + "_modified.srt"with open(new_subtitle_path, 'w', encoding='utf-8') as f:f.write('\n'.join(new_subtitle_content))print(f"Processed subtitles for {filename} saved to {new_subtitle_path}")

最终处理后,还需要将字幕文件的名称进行更改,要求和视频文件名称保持一致,删除掉2.3节中添加的后缀_adjusted_modified,本文使用的工具是文件CHB renamer,读者也可以写代码进行文件名称的修改

3、字幕翻译

第2步的处理均是为字幕的顺利翻译做的预处理工作,预处理工作完成后,就可以直接使用ANTO进行单个或批量字幕文件翻译了。

读者对本教程有不清楚或实施过程中有疑问的,可以评论或私信联系博主。

这篇关于【教程】英文字幕批量翻译的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/984076

相关文章

Python pandas库自学超详细教程

《Pythonpandas库自学超详细教程》文章介绍了Pandas库的基本功能、安装方法及核心操作,涵盖数据导入(CSV/Excel等)、数据结构(Series、DataFrame)、数据清洗、转换... 目录一、什么是Pandas库(1)、Pandas 应用(2)、Pandas 功能(3)、数据结构二、安

2025版mysql8.0.41 winx64 手动安装详细教程

《2025版mysql8.0.41winx64手动安装详细教程》本文指导Windows系统下MySQL安装配置,包含解压、设置环境变量、my.ini配置、初始化密码获取、服务安装与手动启动等步骤,... 目录一、下载安装包二、配置环境变量三、安装配置四、启动 mysql 服务,修改密码一、下载安装包安装地

电脑提示d3dx11_43.dll缺失怎么办? DLL文件丢失的多种修复教程

《电脑提示d3dx11_43.dll缺失怎么办?DLL文件丢失的多种修复教程》在使用电脑玩游戏或运行某些图形处理软件时,有时会遇到系统提示“d3dx11_43.dll缺失”的错误,下面我们就来分享超... 在计算机使用过程中,我们可能会遇到一些错误提示,其中之一就是缺失某个dll文件。其中,d3dx11_4

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库

Linux下在线安装启动VNC教程

《Linux下在线安装启动VNC教程》本文指导在CentOS7上在线安装VNC,包含安装、配置密码、启动/停止、清理重启步骤及注意事项,强调需安装VNC桌面以避免黑屏,并解决端口冲突和目录权限问题... 目录描述安装VNC安装 VNC 桌面可能遇到的问题总结描js述linux中的VNC就类似于Window

Go语言编译环境设置教程

《Go语言编译环境设置教程》Go语言支持高并发(goroutine)、自动垃圾回收,编译为跨平台二进制文件,云原生兼容且社区活跃,开发便捷,内置测试与vet工具辅助检测错误,依赖模块化管理,提升开发效... 目录Go语言优势下载 Go  配置编译环境配置 GOPROXYIDE 设置(VS Code)一些基本

linux批量替换文件内容的实现方式

《linux批量替换文件内容的实现方式》本文总结了Linux中批量替换文件内容的几种方法,包括使用sed替换文件夹内所有文件、单个文件内容及逐行字符串,强调使用反引号和绝对路径,并分享个人经验供参考... 目录一、linux批量替换文件内容 二、替换文件内所有匹配的字符串 三、替换每一行中全部str1为st

基于Python开发一个图像水印批量添加工具

《基于Python开发一个图像水印批量添加工具》在当今数字化内容爆炸式增长的时代,图像版权保护已成为创作者和企业的核心需求,本方案将详细介绍一个基于PythonPIL库的工业级图像水印解决方案,有需要... 目录一、系统架构设计1.1 整体处理流程1.2 类结构设计(扩展版本)二、核心算法深入解析2.1 自

Python自动化批量重命名与整理文件系统

《Python自动化批量重命名与整理文件系统》这篇文章主要为大家详细介绍了如何使用Python实现一个强大的文件批量重命名与整理工具,帮助开发者自动化这一繁琐过程,有需要的小伙伴可以了解下... 目录简介环境准备项目功能概述代码详细解析1. 导入必要的库2. 配置参数设置3. 创建日志系统4. 安全文件名处

SpringBoot中六种批量更新Mysql的方式效率对比分析

《SpringBoot中六种批量更新Mysql的方式效率对比分析》文章比较了MySQL大数据量批量更新的多种方法,指出REPLACEINTO和ONDUPLICATEKEY效率最高但存在数据风险,MyB... 目录效率比较测试结构数据库初始化测试数据批量修改方案第一种 for第二种 case when第三种