【教程】英文字幕批量翻译

2024-05-12 23:44

本文主要是介绍【教程】英文字幕批量翻译,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文介绍批量翻译英文字幕的方法

文章目录

  • 1、字幕翻译工具ANTO
  • 2、导出内封的字幕文件
    • 2.1 ffmpeg的安装
    • 2.2 字幕提取
    • 2.3 字幕两行调增为一行
  • 3、字幕翻译

1、字幕翻译工具ANTO

字幕翻译工具ANTO

下载链接:https://github.com/speauty/anto/releases

感谢github作者speauty的贡献

本工具可以直接对srt字幕文件进行单个或批量翻译

2、导出内封的字幕文件

有的字幕文件是内嵌在视频文件中的,即MP4文件中包含了srt字幕文件,这时需要使用ffmpeg工具提取出字幕文件

2.1 ffmpeg的安装

ffmpeg的安装参考文章FFmpeg详细安装步骤和使用笔记,在此感谢博主瞿同学(Darren)的贡献

2.2 字幕提取

修改自己的视频文件夹的路径,运行后即可提取出srt字幕文件,由于ffmpeg提取的时候会添加上默认的字体格式、大小,代码中也写了相应的语句进行删除,即保存的srt字幕为纯文本格式

import os
import subprocess
import re
# 设置视频文件夹路径
video_folder = "D:\your_videos_folder"
# 遍历视频文件夹中的所有文件
for filename in os.listdir(video_folder):# 检查文件是否是视频文件(这里简单地通过文件扩展名来判断)if filename.endswith((".mp4", ".avi", ".mkv")):# 构建视频文件路径video_path = os.path.join(video_folder, filename)# 构建字幕文件路径,保持与视频文件名一致,但扩展名为srtsubtitle_path = os.path.splitext(video_path)[0] + ".srt"# 运行FFmpeg命令来提取字幕ffmpeg_cmd = ['ffmpeg', '-i', video_path, '-map', '0:s:0', subtitle_path]subprocess.run(ffmpeg_cmd)print(f"Extracted subtitles for {filename}")# 处理生成的字幕文件,删除<font>标签with open(subtitle_path, 'r', encoding='utf-8') as file:subtitle_content = file.read()# 使用正则表达式删除<font>标签clean_subtitle_content = re.sub(r'<font face="Serif" size="18">|</font>', '', subtitle_content)# 写回到字幕文件中with open(subtitle_path, 'w', encoding='utf-8') as file:file.write(clean_subtitle_content)print(f"Cleaned subtitles for {filename}")

2.3 字幕两行调增为一行

在使用翻译工具ANTO进行翻译的时候我发现,如果字幕存在换行的情况,则翻译会失效,下方代码可以将字幕文件中存在换行的部分调整到一行

import os
# 设置字幕文件夹路径
subtitle_folder = "D:\your_srt_folder"
# 遍历字幕文件夹中的所有字幕文件
for filename in os.listdir(subtitle_folder):if filename.endswith('.srt'):subtitle_path = os.path.join(subtitle_folder, filename)# 读取原始字幕文件内容with open(subtitle_path, 'r', encoding='utf-8') as f:subtitle_content = f.readlines()# 调整字幕格式并保存new_subtitle_content = []current_sub = ""for line in subtitle_content:line = line.strip()if line == "":# 如果是空行,直接添加到新的字幕内容中# new_subtitle_content.append(line)passelif line.isdigit():# 如果是字幕序号行,直接添加到新的字幕内容中if current_sub:new_subtitle_content.append(current_sub)current_sub = ""new_subtitle_content.append(line)elif '-->' in line:# 如果是时间轴行,直接添加到新的字幕内容中new_subtitle_content.append(line)else:# 如果是字幕内容行,将内容添加到当前字幕中current_sub += line + " "# 添加最后一个字幕if current_sub:new_subtitle_content.append(current_sub)# 写入新的字幕文件new_subtitle_path = os.path.splitext(subtitle_path)[0] + "_adjusted.srt"with open(new_subtitle_path, 'w', encoding='utf-8') as f:f.write('\n'.join(new_subtitle_content))print(f"Adjusted subtitles for {filename} saved to {new_subtitle_path}")

调整后,会删除掉原来的空白行,标准的字幕文件每个时间戳之间会有空行,下方的代码实现添加空行

import os
# 设置字幕文件夹路径
subtitle_folder = "D:\your_adjusted_srt_folder"
# 遍历字幕文件夹中的所有字幕文件
for filename in os.listdir(subtitle_folder):if filename.endswith('.srt'):subtitle_path = os.path.join(subtitle_folder, filename)# 读取原始字幕文件内容with open(subtitle_path, 'r', encoding='utf-8') as f:subtitle_content = f.readlines()# 在每一句字幕的下方增加一个空白行new_subtitle_content = []for line in subtitle_content:new_subtitle_content.append(line.strip())# 如果是空行或者时间轴行,则不添加空白行if line.strip() and not line.strip().isdigit() and '-->' not in line:new_subtitle_content.append('')  # 添加一个空白行# 写入新的字幕文件new_subtitle_path = os.path.splitext(subtitle_path)[0] + "_modified.srt"with open(new_subtitle_path, 'w', encoding='utf-8') as f:f.write('\n'.join(new_subtitle_content))print(f"Processed subtitles for {filename} saved to {new_subtitle_path}")

最终处理后,还需要将字幕文件的名称进行更改,要求和视频文件名称保持一致,删除掉2.3节中添加的后缀_adjusted_modified,本文使用的工具是文件CHB renamer,读者也可以写代码进行文件名称的修改

3、字幕翻译

第2步的处理均是为字幕的顺利翻译做的预处理工作,预处理工作完成后,就可以直接使用ANTO进行单个或批量字幕文件翻译了。

读者对本教程有不清楚或实施过程中有疑问的,可以评论或私信联系博主。

这篇关于【教程】英文字幕批量翻译的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/984076

相关文章

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

C#实现一键批量合并PDF文档

《C#实现一键批量合并PDF文档》这篇文章主要为大家详细介绍了如何使用C#实现一键批量合并PDF文档功能,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言效果展示功能实现1、添加文件2、文件分组(书签)3、定义页码范围4、自定义显示5、定义页面尺寸6、PDF批量合并7、其他方法

基于C#实现PDF转图片的详细教程

《基于C#实现PDF转图片的详细教程》在数字化办公场景中,PDF文件的可视化处理需求日益增长,本文将围绕Spire.PDFfor.NET这一工具,详解如何通过C#将PDF转换为JPG、PNG等主流图片... 目录引言一、组件部署二、快速入门:PDF 转图片的核心 C# 代码三、分辨率设置 - 清晰度的决定因

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

spring AMQP代码生成rabbitmq的exchange and queue教程

《springAMQP代码生成rabbitmq的exchangeandqueue教程》使用SpringAMQP代码直接创建RabbitMQexchange和queue,并确保绑定关系自动成立,简... 目录spring AMQP代码生成rabbitmq的exchange and 编程queue执行结果总结s

Python批量替换多个Word文档的多个关键字的方法

《Python批量替换多个Word文档的多个关键字的方法》有时,我们手头上有多个Excel或者Word文件,但是领导突然要求对某几个术语进行批量的修改,你是不是有要崩溃的感觉,所以本文给大家介绍了Py... 目录工具准备先梳理一下思路神奇代码来啦!代码详解激动人心的测试结语嘿,各位小伙伴们,大家好!有没有想