Vehicle Speech Enhancement Model with Joint BiLSTM and ECA

Noise and Vibration Control ›› 2026, Vol. 46 ›› Issue (2): 121-128.

Previous Articles Next Articles

Vehicle Speech Enhancement Model with Joint BiLSTM and ECA

Received:2024-10-09 Revised:2024-12-11 Online:2026-04-18 Published:2026-04-17

联合BiLSTM与ECA的车载语音增强模型研究

魏星，王攀，杨礼强，陈海林

( 重庆大学机械与运载工程学院，重庆400044 )

Abstract

摘要： 伴随汽车智能化发展，车载语音交互日趋广泛，车内复杂声学环境下准确识别语音指令的需求日益突显，基于深度学习的语音增强成为解决该问题的有效方法。基于卷积时域音频分离网络(Convolutional Time-domain Audio Separation Network，Conv-TasNet)，设计一种联合双向长短时记忆网络(Bidirectional Long Short-term Memory，BiLSTM)与高效通道注意力(Efficient Channel Attention，ECA)模块的语音增强模型。采用编/解码层对带噪语音进行高维嵌入与波形重构，增强模块提取语音特征并计算目标纯净语音的掩码。在特征提取阶段引入BiLSTM网络，提升模型对复杂长时序列的处理能力以提取深层语音特征。另外在卷积通道后引入ECA模块，提高对于目标语音特征的关注度，减少无用特征干扰。以尺度不变信噪比(Scale-Invariant Source-to- noise Ratio，SI-SNR)为训练目标，在车内带噪语音数据集上进行训练与测试。所设计模型相较于基线模型，主观与客观评价指标均得到提升。车内带噪语音经过模型增强后，语音质量与可懂度取得大幅提高，实际语音增强效果明显。

关键词: 声学, 语音增强, 深度学习, 车舱噪声, 车载语音交互, 注意力机制

魏星, 王攀, 杨礼强, 陈海林. 联合BiLSTM与ECA的车载语音增强模型研究[J]. 噪声与振动控制, 2026, 46(2): 121-128.

Vehicle Speech Enhancement Model with Joint BiLSTM and ECA

联合BiLSTM与ECA的车载语音增强模型研究

PDF

Knowledge

Abstract

Cite this article

share this article

References

Related Articles 0

Recommended Articles

Metrics