Noise and Vibration Control ›› 2026, Vol. 46 ›› Issue (2): 121-128.
Previous Articles Next Articles
Received:
Revised:
Online:
Published:
魏星,王攀,杨礼强,陈海林
摘要: 伴随汽车智能化发展,车载语音交互日趋广泛,车内复杂声学环境下准确识别语音指令的需求日益突显,基于深度学习的语音增强成为解决该问题的有效方法。基于卷积时域音频分离网络(Convolutional Time-domain Audio Separation Network,Conv-TasNet),设计一种联合双向长短时记忆网络(Bidirectional Long Short-term Memory,BiLSTM)与高效通道注意力(Efficient Channel Attention,ECA)模块的语音增强模型。采用编/解码层对带噪语音进行高维嵌入与波形重构,增强模块提取语音特征并计算目标纯净语音的掩码。在特征提取阶段引入BiLSTM网络,提升模型对复杂长时序列的处理能力以提取深层语音特征。另外在卷积通道后引入ECA模块,提高对于目标语音特征的关注度,减少无用特征干扰。以尺度不变信噪比(Scale-Invariant Source-to- noise Ratio,SI-SNR)为训练目标,在车内带噪语音数据集上进行训练与测试。所设计模型相较于基线模型,主观与客观评价指标均得到提升。车内带噪语音经过模型增强后,语音质量与可懂度取得大幅提高,实际语音增强效果明显。
关键词: 声学, 语音增强, 深度学习, 车舱噪声, 车载语音交互, 注意力机制
魏星, 王攀, 杨礼强, 陈海林. 联合BiLSTM与ECA的车载语音增强模型研究[J]. 噪声与振动控制, 2026, 46(2): 121-128.
0 / Recommend
Add to citation manager EndNote|Ris|BibTeX
URL: https://nvc.sjtu.edu.cn/EN/
https://nvc.sjtu.edu.cn/EN/Y2026/V46/I2/121