AWS提高声音辨识精确度为解决ML训练数据平衡性

2024-02-10 06:10

本文主要是介绍AWS提高声音辨识精确度为解决ML训练数据平衡性,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2019独角兽企业重金招聘Python工程师标准>>> hot3.png

AWS研究团队发表了一项用于解决训练资料不平衡的新技术,在研究实验中,AWS用新技术来处理辨识特定声音的问题,像是玻璃打破的声音或是婴儿的哭声,实验结果显示,相比一般常用的神经网络声音辨识方法,新方法将错误率降低了15%~30%,AWS也将在5月举行的IEEE 讯号与资通讯科技国际会议中,发表用新技术修正训练样本不平衡的问题。AWS指出,大多数现代的机器学习系统都是分类器,系统将输入数据分类到不同的种类中,像是特定动物的照片,理想上来说,当一个系统被训练来辨识多个种类,每个种类的训练样本数量大致上要差不多,像是猫、狗和马,若训练样本数量没有大致相等,系统的辨识结果可能会偏向较多训练样本的种类。

训练数据不平衡的问题有时候难以避免,但是必须在训练的过程修正该问题,解决该问题标准的方法是增加代表性不足样本的权重,也就是在训练过程中,于目标函数中增加特定类别权重,另外还有一项更进阶的方法是训练一个神经网络来产生能够抓取不同类别之间差异的向量空间,不过,对学习向量空间而言,数据不平衡也是一个问题,在训练的过程中,若任何数据类别比其他的数据类别大,该类别的数据会分成多个群,来与最小的类别的大小相匹配。为了解决这个问题,AWS开发了一套会持续计算每个数据群向量空间重心的算法,该重心为将所有群中心点的平均距离最小化的点,透过每个新计算出来的向量,AWS的算法能够计算重心到各个群的距离,将向量网络训练后,AWS用训练后生成的输出数据当作新分类器的训练数据,来解决训练数据不平衡的问题。更多内文来源至:胜博发星座预测运势 http://mitsp.com/

转载于:https://my.oschina.net/u/4024424/blog/3021465

这篇关于AWS提高声音辨识精确度为解决ML训练数据平衡性的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/696323

相关文章

IDEA和GIT关于文件中LF和CRLF问题及解决

《IDEA和GIT关于文件中LF和CRLF问题及解决》文章总结:因IDEA默认使用CRLF换行符导致Shell脚本在Linux运行报错,需在编辑器和Git中统一为LF,通过调整Git的core.aut... 目录问题描述问题思考解决过程总结问题描述项目软件安装shell脚本上git仓库管理,但拉取后,上l

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

解决docker目录内存不足扩容处理方案

《解决docker目录内存不足扩容处理方案》文章介绍了Docker存储目录迁移方法:因系统盘空间不足,需将Docker数据迁移到更大磁盘(如/home/docker),通过修改daemon.json配... 目录1、查看服务器所有磁盘的使用情况2、查看docker镜像和容器存储目录的空间大小3、停止dock

idea npm install很慢问题及解决(nodejs)

《ideanpminstall很慢问题及解决(nodejs)》npm安装速度慢可通过配置国内镜像源(如淘宝)、清理缓存及切换工具解决,建议设置全局镜像(npmconfigsetregistryht... 目录idea npm install很慢(nodejs)配置国内镜像源清理缓存总结idea npm in

idea突然报错Malformed \uxxxx encoding问题及解决

《idea突然报错Malformeduxxxxencoding问题及解决》Maven项目在切换Git分支时报错,提示project元素为描述符根元素,解决方法:删除Maven仓库中的resolv... 目www.chinasem.cn录问题解决方式总结问题idea 上的 maven China编程项目突然报错,是

在Ubuntu上打不开GitHub的完整解决方法

《在Ubuntu上打不开GitHub的完整解决方法》当你满心欢喜打开Ubuntu准备推送代码时,突然发现终端里的gitpush卡成狗,浏览器里的GitHub页面直接变成Whoathere!警告页面... 目录一、那些年我们遇到的"红色惊叹号"二、三大症状快速诊断症状1:浏览器直接无法访问症状2:终端操作异常

mybatis直接执行完整sql及踩坑解决

《mybatis直接执行完整sql及踩坑解决》MyBatis可通过select标签执行动态SQL,DQL用ListLinkedHashMap接收结果,DML用int处理,注意防御SQL注入,优先使用#... 目录myBATiFBNZQs直接执行完整sql及踩坑select语句采用count、insert、u

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决

《MyBatis/MyBatis-Plus同事务循环调用存储过程获取主键重复问题分析及解决》MyBatis默认开启一级缓存,同一事务中循环调用查询方法时会重复使用缓存数据,导致获取的序列主键值均为1,... 目录问题原因解决办法如果是存储过程总结问题myBATis有如下代码获取序列作为主键IdMappe

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程