开源离线语音识别输入工具CapsWriter v1.0——支持无限时长语音、音视频文件转录字幕。

本文主要是介绍开源离线语音识别输入工具CapsWriter v1.0——支持无限时长语音、音视频文件转录字幕。,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

分享一款开源离线语音识别输入工具,支持无限时长语音、音视频文件转录字幕。

软件简介:

CapsWriter是一款免费开源且可完全离线识别的语音输入工具,无需担心因在线版本识别带来的各种隐私泄露问题。支持win7及以上的系统,已经更新融合了语音输入以及音视频文件实现字幕转录的功能。

软件特性:
1.完全离线、无限时长、低延迟、高准确率、中英混输、自动阿拉伯数字、自动调整中英间隔。
2.热词功能:可以在 hot-en.txthot-zh.txt hot-rule.txt 中添加三种热词,客户端动态识别载入。
3.日记功能:默认每次录音识别后,识别结果记录在 年份/月份/日期.md ,录音文件保存在 年份/月份/assets。
4.关键词日记:识别结果若以关键词开头,会被记录在 年份/月份/关键词-日期.md,关键词在 keywords.txt 中定义。
5.转录功能:将音视频文件拖动到客户端打开,即可转录生成 srt 字幕、txt文本等等。
6.服务端、客户端分离,可以服务多台客户端。

软件使用:

根据系统环境解压后,将两个模型文件夹 paraformer-offline-zh 和 punc_ct-transformer_cn-en 放到软件根目录的 models 文件夹中。然后运行根目录的服务端start_server.exe,等待模型加载完成。最后双击运行start_client.exe客户端。

默认长按键盘上的大写锁定键Capslock,录音开始,当松开大写锁定键 时,就会识别录音,并将识别结果立刻输入到带有输入框的地方。相关识别到的录音和日志默认放在根目录下的文件夹里,不需要或重录时记得及时清理。如需要更改触发按键、单击录音单击停止或端口修改等设置,可自行用记事本等文本编辑工具打开config.py文件进行修改,每一栏都有详细的注释说明。

可将音视频文件拖动到客户端中打开,等待处理即可。但转录字幕功能必须在服务端加载完模型并保持后台运行的情况下才可使用,否则会出现闪退不工作等问题。默认转录之后生成的文件会跟着音视频文件的目录:json 文件:包含了字级时间戳,txt 文件:包含了分行结果,merge.txt 文件:包含了带标点的整段结果,srt 文件:字幕文件,如果生成的字幕有微小错误,可以在分行的 txt 文件中修改,并将 txt 文件拖动到客户端打开,最后自动修正其余字幕文件。
 

软件下载链接:https://pan.quark.cn/s/45a5857f48c8

模型下载地址:https://pan.quark.cn/s/8d27bce21ebc

这篇关于开源离线语音识别输入工具CapsWriter v1.0——支持无限时长语音、音视频文件转录字幕。的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/826207

相关文章

基于Python实现简易视频剪辑工具

《基于Python实现简易视频剪辑工具》这篇文章主要为大家详细介绍了如何用Python打造一个功能完备的简易视频剪辑工具,包括视频文件导入与格式转换,基础剪辑操作,音频处理等功能,感兴趣的小伙伴可以了... 目录一、技术选型与环境搭建二、核心功能模块实现1. 视频基础操作2. 音频处理3. 特效与转场三、高

基于Python开发一个图像水印批量添加工具

《基于Python开发一个图像水印批量添加工具》在当今数字化内容爆炸式增长的时代,图像版权保护已成为创作者和企业的核心需求,本方案将详细介绍一个基于PythonPIL库的工业级图像水印解决方案,有需要... 目录一、系统架构设计1.1 整体处理流程1.2 类结构设计(扩展版本)二、核心算法深入解析2.1 自

Python办公自动化实战之打造智能邮件发送工具

《Python办公自动化实战之打造智能邮件发送工具》在数字化办公场景中,邮件自动化是提升工作效率的关键技能,本文将演示如何使用Python的smtplib和email库构建一个支持图文混排,多附件,多... 目录前言一、基础配置:搭建邮件发送框架1.1 邮箱服务准备1.2 核心库导入1.3 基础发送函数二、

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python使用pip工具实现包自动更新的多种方法

《Python使用pip工具实现包自动更新的多种方法》本文深入探讨了使用Python的pip工具实现包自动更新的各种方法和技术,我们将从基础概念开始,逐步介绍手动更新方法、自动化脚本编写、结合CI/C... 目录1. 背景介绍1.1 目的和范围1.2 预期读者1.3 文档结构概述1.4 术语表1.4.1 核

Python使用OpenCV实现获取视频时长的小工具

《Python使用OpenCV实现获取视频时长的小工具》在处理视频数据时,获取视频的时长是一项常见且基础的需求,本文将详细介绍如何使用Python和OpenCV获取视频时长,并对每一行代码进行深入解析... 目录一、代码实现二、代码解析1. 导入 OpenCV 库2. 定义获取视频时长的函数3. 打开视频文

Linux中压缩、网络传输与系统监控工具的使用完整指南

《Linux中压缩、网络传输与系统监控工具的使用完整指南》在Linux系统管理中,压缩与传输工具是数据备份和远程协作的桥梁,而系统监控工具则是保障服务器稳定运行的眼睛,下面小编就来和大家详细介绍一下它... 目录引言一、压缩与解压:数据存储与传输的优化核心1. zip/unzip:通用压缩格式的便捷操作2.

sqlite3 命令行工具使用指南

《sqlite3命令行工具使用指南》本文系统介绍sqlite3CLI的启动、数据库操作、元数据查询、数据导入导出及输出格式化命令,涵盖文件管理、备份恢复、性能统计等实用功能,并说明命令分类、SQL语... 目录一、启动与退出二、数据库与文件操作三、元数据查询四、数据操作与导入导出五、查询输出格式化六、实用功

k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)

《k8s上运行的mysql、mariadb数据库的备份记录(支持x86和arm两种架构)》本文记录在K8s上运行的MySQL/MariaDB备份方案,通过工具容器执行mysqldump,结合定时任务实... 目录前言一、获取需要备份的数据库的信息二、备份步骤1.准备工作(X86)1.准备工作(arm)2.手

基于Python开发Windows屏幕控制工具

《基于Python开发Windows屏幕控制工具》在数字化办公时代,屏幕管理已成为提升工作效率和保护眼睛健康的重要环节,本文将分享一个基于Python和PySide6开发的Windows屏幕控制工具,... 目录概述功能亮点界面展示实现步骤详解1. 环境准备2. 亮度控制模块3. 息屏功能实现4. 息屏时间