基于EMD-FBank多尺度特征提取的构音障碍语音识别模型分析-电子技术杂志社

友情链接

基于EMD-FBank多尺度特征提取的构音障碍语音识别模型分析

2025.05.08点击：

摘要：阐述一种基于EMD-FBank的多尺度特征提取构音障碍语音识别模型。首先，利用经验模态分解（EMD）对语音信号进行分解，对分解后的信号计算短时傅立叶变换（STFT）并重新合成，提取FBank特征及其一阶、二阶差分特征，组合为EMD-FBank图谱特征。其次，采用压缩激励模块（SE）改进深度可分离卷积（DSC）模块。最后，结合EMD-FBank特征提取方法和SE改进的DSC模块，构建了构音障碍语音识别模型，并在普通话构音障碍语音数据集AISHELL-MDSC上进行训练和解码。

关键词：构音障碍;语音识别;EMD;FBank;

基金资助：国家自然科学基金（62063001）；

专辑：信息科技;医药卫生科技

专题：眼科与耳鼻咽喉科;电信技术

分类号： TN912.34;R767.92

在线公开时间： 2025-04-11 10:14（知网平台在线公开时间，不代表文献的发表时间）

上一篇：可穿戴式有害气体监测与生命安全预警系统设计 2025/5/8
下一篇：PGNAA煤质分析仪中的中子源MCNP模拟优化分析 2025/5/8

电子技术杂志社

期刊封面

在线办公系统

友情链接

新闻动态 > 本期录用

基于EMD-FBank多尺度特征提取的构音障碍语音识别模型分析