ICASSP2023|达摩院语音实验室入选论文全况速览( 三 )


图示.up()训练架构图示
12and Noise Dual-withLoss for
论文作者:芦皓宇、李楠、王龙标、党建武、王晓宝、张仕良
论文单位:天津大学、阿里巴巴集团
核心内容:近年来,语音增强前端( )和语音识别( )后端的联合训练被广泛用于提高语音识别系统的鲁棒性 。传统的联合训练方法仅使用增强语音作为后端输入 。由于具有不同强度的各种类型的噪声使得语音增强系统很难直接将语音从输入中分离出来 。此外,在增强语音中经常观察到语音失真和残留噪声,并且语音和噪声的失真是不同的 。大多数现有方法都侧重于融合增强特征和噪声特征来解决这个问题 。
在本文中,我们提出了一个双流频谱图精炼网络(dual-)来同时精炼语音和噪声,并将噪声与从带噪的原始输入信号中解耦出来 。我们在-1任务上验证了所提出的方案,实验结果表明我们提出的方法可以获得更好的增强效果,语音识别字错误率相对降低8.6% 。
13 The DKU Post- Audio- Wake Wordfor the 2021 MISP : Deep