不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频

本文主要是介绍不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先,打开window系统中的cmd命令行工具,或者powershell,安装腾讯云tencentcloud的Python库

pip install -i https://mirrors.tencent.com/pypi/simple/ --upgrade tencentcloud-sdk-python

然后,开通腾讯云的对象存储COS服务,

把要转录成文本的mp3音频文件上传到腾讯云的存储桶:

把这个存储桶的访问权限 设置为:公有读私有写

申请腾讯云语音识别资源包的免费额度(10小时),该免费额度将以预付费资源包的形式在每月1号自动发放,仅在当月有效 。然后新建API密钥:访问管理-API密钥管理—新建密钥,即可生成API/SDK调用所需的签名APPID、SecretId与SecretKey信息。。

最后,在AI大模型聊天应用deepseek中输入提示词:

你是一个Python编程专家,要写一个通过腾讯云的语音识别API进行批量AI语音识别的Python脚本,具体步骤如下:

腾讯云SecretId是XXX,SecretKey是XXX

音频文件URL列表如下:https://mp3file-1318366850.cos.ap-guangzhou.myqcloud.com/AI%E6%97%B6%E4%BB%A3%E7%9A%84%E5%86%99%E4%BD%9C%E6%B3%95%E5%88%99.mp3, https://mp3file-1318366850.cos.ap-guangzhou.myqcloud.com/AI%E8%BE%85%E5%8A%A9%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0%E5%88%9C%E6%B5%81%E7%A8%8B.mp3, https://mp3file-1318366850.cos.ap-guangzhou.myqcloud.com/AI%E9%87%8D%E5%A1%91%E7%A4%BE%E4%BA%A4%E5%86%85%E5%AE%B9.mp3

对于每个音频文件,创建一个语音识别任务,然后定期检查任务状态,直到任务完成或失败。完成后,将识别结果保存到本地文件。识别结果保存到F:\\aivideo\\目录下,文件名为对应的mp3文件名,格式为txt。”

注意:

如果创建任务或查询状态时发生错误,应该打印错误信息;

每一步都要输出信息到屏幕上;

音频文件URL中的mp3文件名经过了URL编码,在命名txt文本时,要解码这段文本, 将其转换回原始的中文文本,然后用这个解码后的文件名来命名txt文档;

deepseek生成的Python源代码:

import os

import time

import json

import urllib.parse

from tencentcloud.common import credential

from tencentcloud.common.profile.client_profile import ClientProfile

from tencentcloud.common.profile.http_profile import HttpProfile

from tencentcloud.common.exception.tencent_cloud_sdk_exception import TencentCloudSDKException

from tencentcloud.asr.v20190614 import asr_client, models

# 腾讯云API的SecretId和SecretKey

SECRET_ID = "XXX"

SECRET_KEY = "XXX"

# 音频文件URL列表

AUDIO_URLS = [

"https://mp3file-1318366850.cos.ap-guangzhou.myqcloud.com/AI%E6%97%B6%E4%BB%A3%E7%9A%84%E5%86%99%E4%BD%9C%E6%B3%95%E5%88%99.mp3",

"https://mp3file-1318366850.cos.ap-guangzhou.myqcloud.com/AI%E8%BE%85%E5%8A%A9%E6%8A%80%E6%9C%AF%E6%96%87%E7%AB%A0%E5%88%9C%E6%B5%81%E7%A8%8B.mp3",

"https://mp3file-1318366850.cos.ap-guangzhou.myqcloud.com/AI%E9%87%8D%E5%A1%91%E7%A4%BE%E4%BA%A4%E5%86%85%E5%AE%B9.mp3"

]

# 保存结果的目录

OUTPUT_DIR = "F:\\aivideo\\"

def create_rec_task(client, url):

try:

req = models.CreateRecTaskRequest()

params = {

"EngineModelType": "16k_zh",

"ChannelNum": 1,

"ResTextFormat": 0,

"SourceType": 0,

"Url": url

}

req.from_json_string(json.dumps(params))

resp = client.CreateRecTask(req)

print(f"Task created for URL: {url}, Task ID: {resp.Data.TaskId}")

return resp.Data.TaskId

except TencentCloudSDKException as err:

print(f"Error creating task for URL: {url}, Error: {err}")

return None

def describe_task_status(client, task_id):

try:

req = models.DescribeTaskStatusRequest()

params = {

"TaskId": task_id

}

req.from_json_string(json.dumps(params))

resp = client.DescribeTaskStatus(req)

return resp.Data

except TencentCloudSDKException as err:

print(f"Error describing task status for Task ID: {task_id}, Error: {err}")

return None

def save_result_to_file(url, result):

file_name = urllib.parse.unquote(os.path.basename(url)).replace(".mp3", ".txt")

file_path = os.path.join(OUTPUT_DIR, file_name)

with open(file_path, "w", encoding="utf-8") as f:

f.write(result)

print(f"Result saved to {file_path}")

def main():

cred = credential.Credential(SECRET_ID, SECRET_KEY)

httpProfile = HttpProfile()

httpProfile.endpoint = "http://asr.tencentcloudapi.com"

clientProfile = ClientProfile()

clientProfile.httpProfile = httpProfile

client = asr_client.AsrClient(cred, "ap-guangzhou", clientProfile)

for url in AUDIO_URLS:

task_id = create_rec_task(client, url)

if task_id is None:

continue

while True:

time.sleep(5)

task_status = describe_task_status(client, task_id)

if task_status is None:

continue

if task_status.Status == 2: # 任务完成

print(f"Task ID: {task_id} completed.")

save_result_to_file(url, task_status.Result)

break

elif task_status.Status == 3: # 任务失败

print(f"Task ID: {task_id} failed.")

break

if __name__ == "__main__":

main()

复制以上代码到vscode中,运行程序:

腾讯云语音识别速度很快,一两分钟就把3个几十分钟长度的音频转录完成了。识别的准确率也挺高:

识别完成后,可以查看语音识别资源包的调用情况,包括识别次数和识别小时数:

在语音识别资源包这里面可以查看还有多少免费额度:

这篇关于不用写一行代码,deepseek结合腾讯云语音识别来批量转录Mp3音频的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1086586

相关文章

Java集合之Iterator迭代器实现代码解析

《Java集合之Iterator迭代器实现代码解析》迭代器Iterator是Java集合框架中的一个核心接口,位于java.util包下,它定义了一种标准的元素访问机制,为各种集合类型提供了一种统一的... 目录一、什么是Iterator二、Iterator的核心方法三、基本使用示例四、Iterator的工

Java 线程池+分布式实现代码

《Java线程池+分布式实现代码》在Java开发中,池通过预先创建并管理一定数量的资源,避免频繁创建和销毁资源带来的性能开销,从而提高系统效率,:本文主要介绍Java线程池+分布式实现代码,需要... 目录1. 线程池1.1 自定义线程池实现1.1.1 线程池核心1.1.2 代码示例1.2 总结流程2. J

JS纯前端实现浏览器语音播报、朗读功能的完整代码

《JS纯前端实现浏览器语音播报、朗读功能的完整代码》在现代互联网的发展中,语音技术正逐渐成为改变用户体验的重要一环,下面:本文主要介绍JS纯前端实现浏览器语音播报、朗读功能的相关资料,文中通过代码... 目录一、朗读单条文本:① 语音自选参数,按钮控制语音:② 效果图:二、朗读多条文本:① 语音有默认值:②

Vue实现路由守卫的示例代码

《Vue实现路由守卫的示例代码》Vue路由守卫是控制页面导航的钩子函数,主要用于鉴权、数据预加载等场景,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一、概念二、类型三、实战一、概念路由守卫(Navigation Guards)本质上就是 在路

uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)

《uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)》在uni-app开发中,文件上传和图片处理是很常见的需求,但也经常会遇到各种问题,下面:本文主要介绍uni-app小程序项目中实... 目录方式一:使用<canvas>实现图片压缩(推荐,兼容性好)示例代码(小程序平台):方式二:使用uni

JAVA实现Token自动续期机制的示例代码

《JAVA实现Token自动续期机制的示例代码》本文主要介绍了JAVA实现Token自动续期机制的示例代码,通过动态调整会话生命周期平衡安全性与用户体验,解决固定有效期Token带来的风险与不便,感兴... 目录1. 固定有效期Token的内在局限性2. 自动续期机制:兼顾安全与体验的解决方案3. 总结PS

Ubuntu向多台主机批量传输文件的流程步骤

《Ubuntu向多台主机批量传输文件的流程步骤》:本文主要介绍在Ubuntu中批量传输文件到多台主机的方法,需确保主机互通、用户名密码统一及端口开放,通过安装sshpass工具,准备包含目标主机信... 目录Ubuntu 向多台主机批量传输文件1.安装 sshpass2.准备主机列表文件3.创建一个批处理脚

C#中通过Response.Headers设置自定义参数的代码示例

《C#中通过Response.Headers设置自定义参数的代码示例》:本文主要介绍C#中通过Response.Headers设置自定义响应头的方法,涵盖基础添加、安全校验、生产实践及调试技巧,强... 目录一、基础设置方法1. 直接添加自定义头2. 批量设置模式二、高级配置技巧1. 安全校验机制2. 类型

Python屏幕抓取和录制的详细代码示例

《Python屏幕抓取和录制的详细代码示例》随着现代计算机性能的提高和网络速度的加快,越来越多的用户需要对他们的屏幕进行录制,:本文主要介绍Python屏幕抓取和录制的相关资料,需要的朋友可以参考... 目录一、常用 python 屏幕抓取库二、pyautogui 截屏示例三、mss 高性能截图四、Pill

使用MapStruct实现Java对象映射的示例代码

《使用MapStruct实现Java对象映射的示例代码》本文主要介绍了使用MapStruct实现Java对象映射的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,... 目录一、什么是 MapStruct?二、实战演练:三步集成 MapStruct第一步:添加 Mave