基于EMD-FBank多尺度特征提取的构音障碍语音识别模型分析
2025.05.08点击:
摘要:阐述一种基于EMD-FBank的多尺度特征提取构音障碍语音识别模型。首先,利用经验模态分解(EMD)对语音信号进行分解,对分解后的信号计算短时傅立叶变换(STFT)并重新合成,提取FBank特征及其一阶、二阶差分特征,组合为EMD-FBank图谱特征。其次,采用压缩激励模块(SE)改进深度可分离卷积(DSC)模块。最后,结合EMD-FBank特征提取方法和SE改进的DSC模块,构建了构音障碍语音识别模型,并在普通话构音障碍语音数据集AISHELL-MDSC上进行训练和解码。
关键词: 构音障碍;语音识别;EMD;FBank;
基金资助: 国家自然科学基金(62063001);
专辑: 信息科技;医药卫生科技
专题: 眼科与耳鼻咽喉科;电信技术
分类号: TN912.34;R767.92
在线公开时间: 2025-04-11 10:14(知网平台在线公开时间,不代表文献的发表时间)
- 上一篇:可穿戴式有害气体监测与生命安全预警系统设计 2025/5/8
- 下一篇:PGNAA煤质分析仪中的中子源MCNP模拟优化分析 2025/5/8