Montreal Forced Aligner (MFA)安装教程及异常处理

2024-02-12 05:18

本文主要是介绍Montreal Forced Aligner (MFA)安装教程及异常处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

官方地址:https://montreal-forced-aligner.readthedocs.io/en/latest/index.html

文末附常见问题解决方法:

1、FileNotFoundError: [Errno 2] No such file or directory: ‘xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’
2、kaldi包不匹配,大致描述是 mfa thirdparty kaldi


1、MFA简介

Forced alignment is a technique to take an orthographic transcription of an audio file and generate a time-aligned version using a pronunciation dictionary to look up phones for words.

Montreal Forced Aligner (MFA),一种强制对齐工具,用来生成音频 音素时长的工具

2、安装

具体请参考:

MFA installation

需要安装conda/miniconda,视系统版本还需要安装kaldi。

这里以Ubuntu 18.04为例(其它的OS会有些许不同,参考上面的网页),介绍大致的步骤:

(1)安装Anaconda或者Miniconda

Miniconda

(2)切换环境

conda create -n aligner -c conda-forge openblas python=3.8 openfst pynini ngram baumwelch

完成之后确保你在新的环境

conda activate aligner

(3)安装MFA

pip install montreal-forced-aligner

前面都比较正常,没有遇到异常

(4)安装第三方包

mfa thirdparty download

这一步出现了报错:报错是网络 connect 问题,显示 raw.githubusercontent.com 访问不上,一致进入本地,然后自己添加 hosts 进行了重定向进行了解决, 此包比较大,所以需要一些时间进行下载

(5)安装sox(可选)

安装方法请自行搜索。

其实安装sox主要是为了能align除.wav格式之外的文件,如果你不需要的话则可以省略这一步。

(6)升级到最新版

首先确保你在新的环境(aligner),然后执行:

pip install montreal-forced-aligner -U

出现

-- Requirement already satisfied:xxx --

这里一般可以跳过(
到这里就大致结束了,如果你的系统版本较低,需要安装kaldi,参考:

Kaldi github

安装结束之后执行:

mfa thirdparty kaldi /path/to/kaldi/repo

最后执行:

mfa thirdparty validate

来验证安装是否成功。
正常会显示:
All required kaldi binaries were found!

所有步骤结束之后执行:

mfa version

可以看到目前的版本。

如,显示
2.0.0a24

OK,安装成功。(不过可能还是会出现库的兼容问题,如下文的两种常见问题)

部分参考:
https://zhuanlan.zhihu.com/p/386884727


安装中常见问题:

1、FileNotFoundError: [Errno 2] No such file or directory: 'xxx/MFA/LJSpeech_raw/corpus_data/split1/feats.0.scp’

sudo apt-get install libatlas3-base
and
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$HOME/anaconda3/envs/aligner/lib/
注意,上面的需要改成自己的虚拟环境路径 $HOME/anaconda3/envs/aligner/lib/,通过 which mfa 查看,然后进行替换,例如 /opt/anaconda3/envs/aligner/lib
如果需要永久写入,修改bash: vi ~/.bashrc
添加行 export xxxx
参考:https://github.com/MontrealCorpusTools/Montreal-Forced-Aligner/issues/217

2、kaldi包不匹配
大致描述是 mfa thirdparty kaldi

这种情况下就需要进行重新编译,安装,然后重定向:
参考(https://githubmemory.com/repo/MontrealCorpusTools/Montreal-Forced-Aligner/issues/311)

根据官网的 INSTALL,主要分为两步:https://github.com/kaldi-asr/kaldi

①进入 tools 指导安装
在这里插入图片描述
过程中可能会遇到 下载中断问题,建议直接手动下载然后上传到当前目录(即 tools) 里面,方便顺利编译!
② 进入src ,根据INSTALL进行
在这里插入图片描述
建议使用 -j 8 进行加速
完成时,注意记录 kaldi 新的安装路径,用于后面的重新建立新连接,正常情况下,最后完成会出现:
make[1]: Leaving directory 'xxx/xxx/xxx/kaldi/kaldi-master
上面的目录就是我们要定向的目录了,完成 kaldi 安装后:
mfa thirdparty kaldi /home/xxx/xxx/kaldi 即可

重新运行:
在这里插入图片描述
运行成功!

这篇关于Montreal Forced Aligner (MFA)安装教程及异常处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/701743

相关文章

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

Debian 13升级后网络转发等功能异常怎么办? 并非错误而是管理机制变更

《Debian13升级后网络转发等功能异常怎么办?并非错误而是管理机制变更》很多朋友反馈,更新到Debian13后网络转发等功能异常,这并非BUG而是Debian13Trixie调整... 日前 Debian 13 Trixie 发布后已经有众多网友升级到新版本,只不过升级后发现某些功能存在异常,例如网络转

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

C#文件复制异常:"未能找到文件"的解决方案与预防措施

《C#文件复制异常:未能找到文件的解决方案与预防措施》在C#开发中,文件操作是基础中的基础,但有时最基础的File.Copy()方法也会抛出令人困惑的异常,当targetFilePath设置为D:2... 目录一个看似简单的文件操作问题问题重现与错误分析错误代码示例错误信息根本原因分析全面解决方案1. 确保

基于C#实现PDF转图片的详细教程

《基于C#实现PDF转图片的详细教程》在数字化办公场景中,PDF文件的可视化处理需求日益增长,本文将围绕Spire.PDFfor.NET这一工具,详解如何通过C#将PDF转换为JPG、PNG等主流图片... 目录引言一、组件部署二、快速入门:PDF 转图片的核心 C# 代码三、分辨率设置 - 清晰度的决定因

Python自动化处理PDF文档的操作完整指南

《Python自动化处理PDF文档的操作完整指南》在办公自动化中,PDF文档处理是一项常见需求,本文将介绍如何使用Python实现PDF文档的自动化处理,感兴趣的小伙伴可以跟随小编一起学习一下... 目录使用pymupdf读写PDF文件基本概念安装pymupdf提取文本内容提取图像添加水印使用pdfplum

C# LiteDB处理时间序列数据的高性能解决方案

《C#LiteDB处理时间序列数据的高性能解决方案》LiteDB作为.NET生态下的轻量级嵌入式NoSQL数据库,一直是时间序列处理的优选方案,本文将为大家大家简单介绍一下LiteDB处理时间序列数... 目录为什么选择LiteDB处理时间序列数据第一章:LiteDB时间序列数据模型设计1.1 核心设计原则