Noise and Vibration Control ›› 2025, Vol. 45 ›› Issue (2): 97-104.

Previous Articles     Next Articles

Total Variation Regularization Manifold Learning Method for Speech Feature Extraction

  

  • Received:2023-08-08 Revised:2023-11-17 Online:2025-04-18 Published:2025-03-27

语音声特征提取的总变分正则化流形学习方法

张开业1, 2,赵化良1, 2,刘志红1, 2,徐希鑫1, 2,李建华1, 2   

  1. ( 1. 青岛理工大学机械与汽车工程学院,山东青岛266520;
    2. 青岛理工大学工业流体节能与污染控制教育部重点实验室,山东青岛266520 )

摘要: 语音声信号具有显著的时频稀疏性、时变性和高维非线性,为具体表征和有效提取其声特征,提出一种总变分正则化流形学习方法。以局部线性嵌入算法为基础,对预处理后的语音声信号先后进行二次傅里叶变换,再经统计分析提取长时幅值特征,构造包含短时和长时幅值特征的声特征向量,生成高维特征矩阵;在利用总变分对其k 邻域进行优化,最后构造基于权重值能量最小化约束的总变分正则化流形学习声特征提取数学模型,经凸优化得出最优权重,解析语音声特征的低维流形。经分析与方法对比,该方法不仅可以明确声特征流形的物理意义,避免流形的扭曲变形,而且还能大幅降低数值计算量,提升计算速度,为智能语音的机器学习和模式识别提供方法技术支持。

关键词: 声学, 语音声信号, 正则化流形, 总变分, 高维特征矩阵, k邻域, 声特征提取