基于EMD-FBank多尺度特征提取的构音障碍语音识别模型分析

2025.05.08点击:

摘要:阐述一种基于EMD-FBank的多尺度特征提取构音障碍语音识别模型。首先,利用经验模态分解(EMD)对语音信号进行分解,对分解后的信号计算短时傅立叶变换(STFT)并重新合成,提取FBank特征及其一阶、二阶差分特征,组合为EMD-FBank图谱特征。其次,采用压缩激励模块(SE)改进深度可分离卷积(DSC)模块。最后,结合EMD-FBank特征提取方法和SE改进的DSC模块,构建了构音障碍语音识别模型,并在普通话构音障碍语音数据集AISHELL-MDSC上进行训练和解码。

关键词: 构音障碍;语音识别;EMD;FBank;

基金资助: 国家自然科学基金(62063001);

专辑: 信息科技;医药卫生科技

专题: 眼科与耳鼻咽喉科;电信技术

分类号: TN912.34;R767.92

在线公开时间: 2025-04-11 10:14(知网平台在线公开时间,不代表文献的发表时间)