Montreal Forced Aligner (MFA)安装教程及异常处理

2024-02-12 05:18

本文主要是介绍Montreal Forced Aligner (MFA)安装教程及异常处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html

文末附常见问题解决方法:

1、FileNotFoundError: [Errno 2] No such file or directory: ‘xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’
2、kaldi包不匹配,大致描述是 mfa thirdparty kaldi


1、MFA简介

Forced alignment is a technique to take an orthographic transcription of an audio file and generate a time-aligned version using a pronunciation dictionary to look up phones for words.

Montreal Forced Aligner (MFA),一种强制对齐工具,用来生成音频 音素时长的工具

2、安装

具体请参考:

MFA installation

需要安装conda/miniconda,视系统版本还需要安装kaldi。

这里以Ubuntu 18.04为例(其它的OS会有些许不同,参考上面的网页),介绍大致的步骤:

(1)安装Anaconda或者Miniconda

Miniconda

(2)切换环境

conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch

完成之后确保你在新的环境

conda activate aligner

(3)安装MFA

pip install montreal-forced-aligner

前面都比较正常,没有遇到异常

(4)安装第三方包

mfa thirdparty download

这一步出现了报错:报错是网络 connect 问题,显示 raw.githubusercontent.com 访问不上,一致进入本地,然后自己添加 hosts 进行了重定向进行了解决, 此包比较大,所以需要一些时间进行下载

(5)安装sox(可选)

安装方法请自行搜索。

其实安装sox主要是为了能align除.wav格式之外的文件,如果你不需要的话则可以省略这一步。

(6)升级到最新版

首先确保你在新的环境(aligner),然后执行:

pip install montreal-forced-aligner -U

出现

-- Requirement already satisfied:xxx --

这里一般可以跳过(
到这里就大致结束了,如果你的系统版本较低,需要安装kaldi,参考:

Kaldi github

安装结束之后执行:

mfa thirdparty kaldi /path/to/kaldi/repo

最后执行:

mfa thirdparty validate

来验证安装是否成功。
正常会显示:
All required kaldi binaries were found!

所有步骤结束之后执行:

mfa version

可以看到目前的版本。

如,显示
2.0.0a24

OK,安装成功。(不过可能还是会出现库的兼容问题,如下文的两种常见问题)

部分参考:
https://zhuanlan.zhihu.com/p/386884727


安装中常见问题:

1、FileNotFoundError: [Errno 2] No such file or directory: 'xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’

sudo apt-get install libatlas3-base
and
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/anaconda3/envs/aligner/lib/
注意,上面的需要改成自己的虚拟环境路径 $HOME/anaconda3/envs/aligner/lib/,通过 which mfa 查看,然后进行替换,例如 /opt/anaconda3/envs/aligner/lib
如果需要永久写入,修改bash: vi ~/.bashrc
添加行 export xxxx
参考:https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner/issues/217

2、kaldi包不匹配
大致描述是 mfa thirdparty kaldi

这种情况下就需要进行重新编译,安装,然后重定向:
参考(https://githubmemory.com/repo/MontrealCorpusTools/Montreal-Forced-Aligner/issues/311)

根据官网的 INSTALL,主要分为两步:https://github.com/kaldi-asr/kaldi

①进入 tools 指导安装
在这里插入图片描述
过程中可能会遇到 下载中断问题,建议直接手动下载然后上传到当前目录(即 tools) 里面,方便顺利编译!
② 进入src ,根据INSTALL进行
在这里插入图片描述
建议使用 -j 8 进行加速
完成时,注意记录 kaldi 新的安装路径,用于后面的重新建立新连接,正常情况下,最后完成会出现:
make[1]: Leaving directory 'xxx/xxx/xxx/kaldi/kaldi-master
上面的目录就是我们要定向的目录了,完成 kaldi 安装后:
mfa thirdparty kaldi /home/xxx/xxx/kaldi 即可

重新运行:
在这里插入图片描述
运行成功!

这篇关于Montreal Forced Aligner (MFA)安装教程及异常处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/701743

相关文章

解决docker目录内存不足扩容处理方案

《解决docker目录内存不足扩容处理方案》文章介绍了Docker存储目录迁移方法:因系统盘空间不足,需将Docker数据迁移到更大磁盘(如/home/docker),通过修改daemon.json配... 目录1、查看服务器所有磁盘的使用情况2、查看docker镜像和容器存储目录的空间大小3、停止dock

全网最全Tomcat完全卸载重装教程小结

《全网最全Tomcat完全卸载重装教程小结》windows系统卸载Tomcat重新通过ZIP方式安装Tomcat,优点是灵活可控,适合开发者自定义配置,手动配置环境变量后,可通过命令行快速启动和管理... 目录一、完全卸载Tomcat1. 停止Tomcat服务2. 通过控制面板卸载3. 手动删除残留文件4.

Python的pandas库基础知识超详细教程

《Python的pandas库基础知识超详细教程》Pandas是Python数据处理核心库,提供Series和DataFrame结构,支持CSV/Excel/SQL等数据源导入及清洗、合并、统计等功能... 目录一、配置环境二、序列和数据表2.1 初始化2.2  获取数值2.3 获取索引2.4 索引取内容2

5 种使用Python自动化处理PDF的实用方法介绍

《5种使用Python自动化处理PDF的实用方法介绍》自动化处理PDF文件已成为减少重复工作、提升工作效率的重要手段,本文将介绍五种实用方法,从内置工具到专业库,帮助你在Python中实现PDF任务... 目录使用内置库(os、subprocess)调用外部工具使用 PyPDF2 进行基本 PDF 操作使用

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

python依赖管理工具UV的安装和使用教程

《python依赖管理工具UV的安装和使用教程》UV是一个用Rust编写的Python包安装和依赖管理工具,比传统工具(如pip)有着更快、更高效的体验,:本文主要介绍python依赖管理工具UV... 目录前言一、命令安装uv二、手动编译安装2.1在archlinux安装uv的依赖工具2.2从github

Python异常处理之避免try-except滥用的3个核心原则

《Python异常处理之避免try-except滥用的3个核心原则》在Python开发中,异常处理是保证程序健壮性的关键机制,本文结合真实案例与Python核心机制,提炼出避免异常滥用的三大原则,有需... 目录一、精准打击:只捕获可预见的异常类型1.1 通用异常捕获的陷阱1.2 精准捕获的实践方案1.3

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

C#实现SHP文件读取与地图显示的完整教程

《C#实现SHP文件读取与地图显示的完整教程》在地理信息系统(GIS)开发中,SHP文件是一种常见的矢量数据格式,本文将详细介绍如何使用C#读取SHP文件并实现地图显示功能,包括坐标转换、图形渲染、平... 目录概述功能特点核心代码解析1. 文件读取与初始化2. 坐标转换3. 图形绘制4. 地图交互功能缩放