噪声与振动控制 ›› 2026, Vol. 46 ›› Issue (2): 121-128.

• 信号处理与故障诊断 • 上一篇    下一篇

联合BiLSTM与ECA的车载语音增强模型研究

魏星王攀杨礼强陈海林   

  1. ( 重庆大学机械与运载工程学院,重庆400044 )
  • 收稿日期:2024-10-09 修回日期:2024-12-11 出版日期:2026-04-18 发布日期:2026-04-17

Vehicle Speech Enhancement Model with Joint BiLSTM and ECA

  • Received:2024-10-09 Revised:2024-12-11 Online:2026-04-18 Published:2026-04-17

摘要: 伴随汽车智能化发展,车载语音交互日趋广泛,车内复杂声学环境下准确识别语音指令的需求日益突显,基于深度学习的语音增强成为解决该问题的有效方法。基于卷积时域音频分离网络(Convolutional Time-domain Audio Separation Network,Conv-TasNet),设计一种联合双向长短时记忆网络(Bidirectional Long Short-term Memory,BiLSTM)与高效通道注意力(Efficient Channel Attention,ECA)模块的语音增强模型。采用编/解码层对带噪语音进行高维嵌入与波形重构,增强模块提取语音特征并计算目标纯净语音的掩码。在特征提取阶段引入BiLSTM网络,提升模型对复杂长时序列的处理能力以提取深层语音特征。另外在卷积通道后引入ECA模块,提高对于目标语音特征的关注度,减少无用特征干扰。以尺度不变信噪比(Scale-Invariant Source-to- noise Ratio,SI-SNR)为训练目标,在车内带噪语音数据集上进行训练与测试。所设计模型相较于基线模型,主观与客观评价指标均得到提升。车内带噪语音经过模型增强后,语音质量与可懂度取得大幅提高,实际语音增强效果明显。

关键词: 声学, 语音增强, 深度学习, 车舱噪声, 车载语音交互, 注意力机制