【信息技术】【2009.11】自动情感识别:声学和韵律参数的研究

本文主要是介绍【信息技术】【2009.11】自动情感识别:声学和韵律参数的研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

本文为澳大利亚新南威尔士大学(作者:Vidhyasaharan Sethu)的博士论文,共186页。

实现具有人与人之间通信自然性的人机语音通信的一个重要步骤是开发一种能够基于语音识别情感的机器。本文利用声学和韵律信息对这一问题进行了研究。在特征层次上,提出了新的群时延和加权频率特征。群延迟特征被显示为强调与共振峰带宽相关的信息,并且被显示为情绪表示。基于最近引入的经验模态分解,提出将加权频率特征作为谱能量分布的一种紧凑表示,并证明其优于其他能量分布估计。特征级比较表明,详细的频谱测量非常能反映情绪,同时表现出更大的说话人差异性。此外,研究还表明,所有特征都是说话人的表征,在多说话人情况下使用这些特征之前,需要进行某种标准化。提出了一种新的说话人特征可变性归一化方法,该方法显著提高了基于不同说话人数据训练和测试的系统性能。这项技术也被用来研究不同特征中特定于说话人的变异量。语音变异性的初步研究表明,特定音位的特征不受情感模型的影响,说话人的变异性在所研究的情境中是一个更重要的问题。最后,分析了一种考虑语音参数时间变化的情感建模方法。在传统的信源滤波模型的基础上,引入了声门频谱的显式模型,并利用该模型的参数来表征语音信号。一个自动情感识别系统应考虑到这些参数随时间变化的轮廓形状,才能显示出优于一个只建立参数分布模型的系统。这一新方法也被经验证明与人类情感分类的表现不相上下。

An essential step to achievinghuman-machine speech communication with the naturalness of communicationbetween humans is developing a machine that is capable of recognising emotionsbased on speech. This thesis presents research addressing this problem, bymaking use of acoustic and prosodic information. At a feature level, novelgroup delay and weighted frequency features are proposed. The group delayfeatures are shown to emphasise information pertaining to formant bandwidthsand are shown to be indicative of emotions. The weighted frequency feature,based on the recently introduced empirical mode decomposition, is proposed as acompact representation of the spectral energy distribution and is shown tooutperform other estimates of energy distribution. Feature level comparisonssuggest that detailed spectral measures are very indicative of emotions whileexhibiting greater speaker specificity. Moreover, it is shown that all featuresare characteristic of the speaker and require some of sort of normalisationprior to use in a multi-speaker situation. A novel technique for normalisingspeaker-specific variability in features is proposed, which leads tosignificant improvements in the performances of systems trained and tested ondata from different speakers. This technique is also used to investigate theamount of speaker-specific variability in different features. A preliminarystudy of phonetic variability suggests that phoneme specific traits are notmodelled by the emotion models and that speaker variability is a moresignificant problem in the investigated setup. Finally, a novel approach toemotion modelling that takes into account temporal variations of speechparameters is analysed. An explicit model of the glottal spectrum isincorporated into the framework of the traditional source-filter model, and theparameters of this combined model are used to characterise speech signals. Anautomatic emotion recognition system that takes into account the shape of thecontours of these parameters as they vary with time is shown to outperform asystem that models only the parameter distributions. The novel approach is alsoempirically shown to be on par with human emotion classification performance.

  1. 引言
  2. 语音与情感
  3. 语音特征
  4. 说话人可变性
  5. 静态分类方法
  6. 情感识别的语音参数化
  7. 结论与未来工作展望

更多精彩文章请关注公众号:在这里插入图片描述

这篇关于【信息技术】【2009.11】自动情感识别:声学和韵律参数的研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/294127

相关文章

Java使用Spire.Barcode for Java实现条形码生成与识别

《Java使用Spire.BarcodeforJava实现条形码生成与识别》在现代商业和技术领域,条形码无处不在,本教程将引导您深入了解如何在您的Java项目中利用Spire.Barcodefor... 目录1. Spire.Barcode for Java 简介与环境配置2. 使用 Spire.Barco

Apache服务器IP自动跳转域名的问题及解决方案

《Apache服务器IP自动跳转域名的问题及解决方案》本教程将详细介绍如何通过Apache虚拟主机配置实现这一功能,并解决常见问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录​​问题背景​​解决方案​​方法 1:修改 httpd-vhosts.conf(推荐)​​步骤

idea-java序列化serialversionUID自动生成方式

《idea-java序列化serialversionUID自动生成方式》Java的Serializable接口用于实现对象的序列化和反序列化,通过将对象转换为字节流来存储或传输,实现Serializa... 目录简介实现序列化serialVersionUID配置使用总结简介Java.io.Seripyth

Java JAR 启动内存参数配置指南(从基础设置到性能优化)

《JavaJAR启动内存参数配置指南(从基础设置到性能优化)》在启动Java可执行JAR文件时,合理配置JVM内存参数是保障应用稳定性和性能的关键,本文将系统讲解如何通过命令行参数、环境变量等方式... 目录一、核心内存参数详解1.1 堆内存配置1.2 元空间配置(MetASPace)1.3 线程栈配置1.

SpringMVC配置、映射与参数处理​入门案例详解

《SpringMVC配置、映射与参数处理​入门案例详解》文章介绍了SpringMVC框架的基本概念和使用方法,包括如何配置和编写Controller、设置请求映射规则、使用RestFul风格、获取请求... 目录1.SpringMVC概述2.入门案例①导入相关依赖②配置web.XML③配置SpringMVC

JAVA实现Token自动续期机制的示例代码

《JAVA实现Token自动续期机制的示例代码》本文主要介绍了JAVA实现Token自动续期机制的示例代码,通过动态调整会话生命周期平衡安全性与用户体验,解决固定有效期Token带来的风险与不便,感兴... 目录1. 固定有效期Token的内在局限性2. 自动续期机制:兼顾安全与体验的解决方案3. 总结PS

C#中通过Response.Headers设置自定义参数的代码示例

《C#中通过Response.Headers设置自定义参数的代码示例》:本文主要介绍C#中通过Response.Headers设置自定义响应头的方法,涵盖基础添加、安全校验、生产实践及调试技巧,强... 目录一、基础设置方法1. 直接添加自定义头2. 批量设置模式二、高级配置技巧1. 安全校验机制2. 类型

linux部署NFS和autofs自动挂载实现过程

《linux部署NFS和autofs自动挂载实现过程》文章介绍了NFS(网络文件系统)和Autofs的原理与配置,NFS通过RPC实现跨系统文件共享,需配置/etc/exports和nfs.conf,... 目录(一)NFS1. 什么是NFS2.NFS守护进程3.RPC服务4. 原理5. 部署5.1安装NF

如何正确识别一台POE交换机的好坏? 选购可靠的POE交换机注意事项

《如何正确识别一台POE交换机的好坏?选购可靠的POE交换机注意事项》POE技术已经历多年发展,广泛应用于安防监控和无线覆盖等领域,需求量大,但质量参差不齐,市场上POE交换机的品牌繁多,如何正确识... 目录生产标识1. 必须包含的信息2. 劣质设备的常见问题供电标准1. 正规的 POE 标准2. 劣质设

MyBatis Plus实现时间字段自动填充的完整方案

《MyBatisPlus实现时间字段自动填充的完整方案》在日常开发中,我们经常需要记录数据的创建时间和更新时间,传统的做法是在每次插入或更新操作时手动设置这些时间字段,这种方式不仅繁琐,还容易遗漏,... 目录前言解决目标技术栈实现步骤1. 实体类注解配置2. 创建元数据处理器3. 服务层代码优化填充机制详