【教程】英文字幕批量翻译

2024-05-12 23:44

本文主要是介绍【教程】英文字幕批量翻译,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文介绍批量翻译英文字幕的方法

文章目录

  • 1、字幕翻译工具ANTO
  • 2、导出内封的字幕文件
    • 2.1 ffmpeg的安装
    • 2.2 字幕提取
    • 2.3 字幕两行调增为一行
  • 3、字幕翻译

1、字幕翻译工具ANTO

字幕翻译工具ANTO

下载链接:https://github.com/speauty/anto/releases

感谢github作者speauty的贡献

本工具可以直接对srt字幕文件进行单个或批量翻译

2、导出内封的字幕文件

有的字幕文件是内嵌在视频文件中的,即MP4文件中包含了srt字幕文件,这时需要使用ffmpeg工具提取出字幕文件

2.1 ffmpeg的安装

ffmpeg的安装参考文章FFmpeg详细安装步骤和使用笔记,在此感谢博主瞿同学(Darren)的贡献

2.2 字幕提取

修改自己的视频文件夹的路径,运行后即可提取出srt字幕文件,由于ffmpeg提取的时候会添加上默认的字体格式、大小,代码中也写了相应的语句进行删除,即保存的srt字幕为纯文本格式

import os
import subprocess
import re
# 设置视频文件夹路径
video_folder = "D:\your_videos_folder"
# 遍历视频文件夹中的所有文件
for filename in os.listdir(video_folder):# 检查文件是否是视频文件(这里简单地通过文件扩展名来判断)if filename.endswith((".mp4", ".avi", ".mkv")):# 构建视频文件路径video_path = os.path.join(video_folder, filename)# 构建字幕文件路径,保持与视频文件名一致,但扩展名为srtsubtitle_path = os.path.splitext(video_path)[0] + ".srt"# 运行FFmpeg命令来提取字幕ffmpeg_cmd = ['ffmpeg', '-i', video_path, '-map', '0:s:0', subtitle_path]subprocess.run(ffmpeg_cmd)print(f"Extracted subtitles for {filename}")# 处理生成的字幕文件,删除<font>标签with open(subtitle_path, 'r', encoding='utf-8') as file:subtitle_content = file.read()# 使用正则表达式删除<font>标签clean_subtitle_content = re.sub(r'<font face="Serif" size="18">|</font>', '', subtitle_content)# 写回到字幕文件中with open(subtitle_path, 'w', encoding='utf-8') as file:file.write(clean_subtitle_content)print(f"Cleaned subtitles for {filename}")

2.3 字幕两行调增为一行

在使用翻译工具ANTO进行翻译的时候我发现,如果字幕存在换行的情况,则翻译会失效,下方代码可以将字幕文件中存在换行的部分调整到一行

import os
# 设置字幕文件夹路径
subtitle_folder = "D:\your_srt_folder"
# 遍历字幕文件夹中的所有字幕文件
for filename in os.listdir(subtitle_folder):if filename.endswith('.srt'):subtitle_path = os.path.join(subtitle_folder, filename)# 读取原始字幕文件内容with open(subtitle_path, 'r', encoding='utf-8') as f:subtitle_content = f.readlines()# 调整字幕格式并保存new_subtitle_content = []current_sub = ""for line in subtitle_content:line = line.strip()if line == "":# 如果是空行,直接添加到新的字幕内容中# new_subtitle_content.append(line)passelif line.isdigit():# 如果是字幕序号行,直接添加到新的字幕内容中if current_sub:new_subtitle_content.append(current_sub)current_sub = ""new_subtitle_content.append(line)elif '-->' in line:# 如果是时间轴行,直接添加到新的字幕内容中new_subtitle_content.append(line)else:# 如果是字幕内容行,将内容添加到当前字幕中current_sub += line + " "# 添加最后一个字幕if current_sub:new_subtitle_content.append(current_sub)# 写入新的字幕文件new_subtitle_path = os.path.splitext(subtitle_path)[0] + "_adjusted.srt"with open(new_subtitle_path, 'w', encoding='utf-8') as f:f.write('\n'.join(new_subtitle_content))print(f"Adjusted subtitles for {filename} saved to {new_subtitle_path}")

调整后,会删除掉原来的空白行,标准的字幕文件每个时间戳之间会有空行,下方的代码实现添加空行

import os
# 设置字幕文件夹路径
subtitle_folder = "D:\your_adjusted_srt_folder"
# 遍历字幕文件夹中的所有字幕文件
for filename in os.listdir(subtitle_folder):if filename.endswith('.srt'):subtitle_path = os.path.join(subtitle_folder, filename)# 读取原始字幕文件内容with open(subtitle_path, 'r', encoding='utf-8') as f:subtitle_content = f.readlines()# 在每一句字幕的下方增加一个空白行new_subtitle_content = []for line in subtitle_content:new_subtitle_content.append(line.strip())# 如果是空行或者时间轴行,则不添加空白行if line.strip() and not line.strip().isdigit() and '-->' not in line:new_subtitle_content.append('')  # 添加一个空白行# 写入新的字幕文件new_subtitle_path = os.path.splitext(subtitle_path)[0] + "_modified.srt"with open(new_subtitle_path, 'w', encoding='utf-8') as f:f.write('\n'.join(new_subtitle_content))print(f"Processed subtitles for {filename} saved to {new_subtitle_path}")

最终处理后,还需要将字幕文件的名称进行更改,要求和视频文件名称保持一致,删除掉2.3节中添加的后缀_adjusted_modified,本文使用的工具是文件CHB renamer,读者也可以写代码进行文件名称的修改

3、字幕翻译

第2步的处理均是为字幕的顺利翻译做的预处理工作,预处理工作完成后,就可以直接使用ANTO进行单个或批量字幕文件翻译了。

读者对本教程有不清楚或实施过程中有疑问的,可以评论或私信联系博主。

这篇关于【教程】英文字幕批量翻译的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/984076

相关文章

Java中的登录技术保姆级详细教程

《Java中的登录技术保姆级详细教程》:本文主要介绍Java中登录技术保姆级详细教程的相关资料,在Java中我们可以使用各种技术和框架来实现这些功能,文中通过代码介绍的非常详细,需要的朋友可以参考... 目录1.登录思路2.登录标记1.会话技术2.会话跟踪1.Cookie技术2.Session技术3.令牌技

Python使用Code2flow将代码转化为流程图的操作教程

《Python使用Code2flow将代码转化为流程图的操作教程》Code2flow是一款开源工具,能够将代码自动转换为流程图,该工具对于代码审查、调试和理解大型代码库非常有用,在这篇博客中,我们将深... 目录引言1nVflRA、为什么选择 Code2flow?2、安装 Code2flow3、基本功能演示

Java Spring 中的监听器Listener详解与实战教程

《JavaSpring中的监听器Listener详解与实战教程》Spring提供了多种监听器机制,可以用于监听应用生命周期、会话生命周期和请求处理过程中的事件,:本文主要介绍JavaSprin... 目录一、监听器的作用1.1 应用生命周期管理1.2 会话管理1.3 请求处理监控二、创建监听器2.1 Ser

Java如何从Redis中批量读取数据

《Java如何从Redis中批量读取数据》:本文主要介绍Java如何从Redis中批量读取数据的情况,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一.背景概述二.分析与实现三.发现问题与屡次改进3.1.QPS过高而且波动很大3.2.程序中断,抛异常3.3.内存消

MySQL 安装配置超完整教程

《MySQL安装配置超完整教程》MySQL是一款广泛使用的开源关系型数据库管理系统(RDBMS),由瑞典MySQLAB公司开发,目前属于Oracle公司旗下产品,:本文主要介绍MySQL安装配置... 目录一、mysql 简介二、下载 MySQL三、安装 MySQL四、配置环境变量五、配置 MySQL5.1

MQTT SpringBoot整合实战教程

《MQTTSpringBoot整合实战教程》:本文主要介绍MQTTSpringBoot整合实战教程,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录MQTT-SpringBoot创建简单 SpringBoot 项目导入必须依赖增加MQTT相关配置编写

在Java中基于Geotools对PostGIS数据库的空间查询实践教程

《在Java中基于Geotools对PostGIS数据库的空间查询实践教程》本文将深入探讨这一实践,从连接配置到复杂空间查询操作,包括点查询、区域范围查询以及空间关系判断等,全方位展示如何在Java环... 目录前言一、相关技术背景介绍1、评价对象AOI2、数据处理流程二、对AOI空间范围查询实践1、空间查

Logback在SpringBoot中的详细配置教程

《Logback在SpringBoot中的详细配置教程》SpringBoot默认会加载classpath下的logback-spring.xml(推荐)或logback.xml作为Logback的配置... 目录1. Logback 配置文件2. 基础配置示例3. 关键配置项说明Appender(日志输出器

MySQL数据库实现批量表分区完整示例

《MySQL数据库实现批量表分区完整示例》通俗地讲表分区是将一大表,根据条件分割成若干个小表,:本文主要介绍MySQL数据库实现批量表分区的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考... 目录一、表分区条件二、常规表和分区表的区别三、表分区的创建四、将既有表转换分区表脚本五、批量转换表为分区

Kali Linux安装实现教程(亲测有效)

《KaliLinux安装实现教程(亲测有效)》:本文主要介绍KaliLinux安装实现教程(亲测有效),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、下载二、安装总结一、下载1、点http://www.chinasem.cn击链接 Get Kali | Kal