- 标题
- 摘要
- 关键词
- 实验方案
- 产品
-
[IEEE 2019年工业机器人与自动化国际会议(ICRAI) - 巴基斯坦拉瓦尔品第(2019.10.21-2019.10.22)] 2019年工业机器人与自动化国际会议(ICRAI) - 基于低成本二维激光扫描仪的室内建图与分类系统
摘要: 尽管自动说话人识别或语音识别领域在过去几十年中得到了广泛研究,但鲁棒性不足仍是主要挑战。特征规整是一种有前景的方法,其有效性很大程度上取决于滑动窗口中各特征的相对位置。然而噪声的非线性效应会改变这些相对位置。针对该问题,本文利用通过降序排序特征序列直接获得的排序特征,提出一种方法:首先将滑动窗口中的中心帧标记为语音主导或噪声主导("可靠"或"不可靠")。对于不可靠情况,则估计中心帧的排序值。随后,通过期望目标分布将估计排序映射为用于识别实验的规整特征。理论分析与实验结果表明,排序序列的自相关性大于对应特征序列,且秩相关不易受异常数据或高变异数据影响。因此本文处理排序序列而非特征序列。所提特征增强方法在开集说话人识别系统中进行评估,实验显示其在所有噪声条件下均优于基于线性插值的缺失数据方法和特征规整法。此外,本方法作为基于特征的技术,可与基于模型、基于得分等其他技术结合,以提升说话人/语音识别系统的鲁棒性。
关键词: 鲁棒性、排序特征、秩相关、开集说话人识别、自相关、特征弯曲、缺失数据方法
更新于2025-09-23 15:21:01