- 标题
- 摘要
- 关键词
- 实验方案
- 产品
-
[2019年IEEE国际传感器与纳米技术会议(SENSORS & NANO)- 马来西亚槟城(2019.7.24-2019.7.25)] 2019年IEEE国际传感器与纳米技术会议——基于背栅控制硅纳米线的场效应pH传感器制备与表征
摘要: 从语音中提取的声学指标有望成为多种神经及神经发育障碍的新型生物标志物,这一点已得到研究大脑损伤与语音关联的快速增长文献库所证实。本文探讨了语音生物标志物的优势与局限,以及设计和实施便携式语音诊断评估工具面临的各种挑战。此外,我们通过案例研究展示了开发轻度创伤性脑损伤(脑震荡)检测评估工具的经验,并讨论了获取和分析用于研究脑损伤对发声特征影响的大规模语音录音数据集时遇到的挑战。
关键词: 声学特征、语音识别、脑震荡、轻度创伤性脑损伤、语音分析
更新于2025-09-23 15:19:57
-
[2019年IEEE电气绝缘与电介质现象会议(CEIDP) - 美国华盛顿州里奇兰(2019.10.20-2019.10.23)] 2019年IEEE电气绝缘与电介质现象会议(CEIDP) - GIS局部放电超声波检测中迈克尔逊光纤干涉仪的抗干扰方法
摘要: 通过整合额外信息源(如多模态数据、声学通道或声学模型),自动语音识别(ASR)系统的性能可显著提升。针对信息融合这一新兴问题,其与数字通信领域存在显著相似性——Berrou等人发现的Turbo码正是该领域的突破性创新。本文展示了如何成功将Turbo原理应用于ASR领域,从而解决上述信息融合问题。我们的研究贡献包含四个方面:首先,通过详细解析Turbo ASR中的前向-后向算法(FBA),重新阐释并构建了识别器间传递的"外部信息"概念;其次,提出适用于实际信息融合与识别任务的实时Turbo解码Viterbi算法;随后展示多模态信息融合的仿真结果;最后证明我们的Turbo FBA和Turbo Viterbi算法同样适用于采用两种声学特征提取方法的单通道多模型识别任务。在包含拼写挑战的小词汇量任务中,所提出的Turbo ASR方法在所有信噪比条件和噪声类型下均优于最佳参考系统,相对词错误率(WER)分别降低22.4%(视听任务)和18.2%(纯音频任务)。
关键词: 隐马尔可夫模型、语音识别、多媒体系统、鲁棒性、迭代解码
更新于2025-09-19 17:13:59
-
[IEEE TENCON 2019 - 2019年IEEE第十区会议(TENCON) - 印度科钦(2019.10.17-2019.10.20)] TENCON 2019 - 2019年IEEE第十区会议(TENCON) - 基于LSTM和CNN的语音辅助视觉问答系统(含实时图像采集功能)助力视障人士
摘要: 该研究工作使视障人士能够独立于外部支持识别物体并可视化周围场景。在此情境下,用户可通过语音输入向应用程序提出开放式问题、分类问题、计数问题或是非问题。该应用采用视觉问答(VQA)技术整合图像处理与自然语言处理功能,同时具备语音转文字及反向转换能力,从而帮助识别、认知并获取特定图像的详细信息。研究采用经典CNN-LSTM模型,分别计算图像特征与语言特征后,通过从问题中提取的图像特征和词嵌入进行特征融合,再对组合特征运行多层感知机以获得结果。该模型准确率达到57%。此模型还可用于提升儿童的认知理解能力。由于应用支持语音交互并配备简易图形界面,特别适合视障人士使用。
关键词: VGG16、视障人士、Keras神经网络库、ImageNet、gTTS、特征提取、图像识别、VQA、Word2Vec、语音识别、Glove向量、CNN、多层感知机、LSTM
更新于2025-09-16 10:30:52
-
一种适用于局部阴影条件下光伏MPPT的简化传播融合萤火虫算法
摘要: 通过整合额外信息源(如多模态数据、声学通道或声学模型),自动语音识别(ASR)系统的性能可显著提升。针对当前信息融合问题,其与数字通信领域存在显著相似性——Berrou等人发现的Turbo码正是该领域的突破性创新。本文展示了如何成功将Turbo原理应用于ASR领域,从而解决上述信息融合问题。我们的研究贡献包含四个方面:首先,通过深入解析Turbo解码前向-后向算法(FBA),详细阐释Turbo ASR技术,并对识别器间传递的所谓"外部信息"提出新诠释与数学表述;其次,提出适用于实际信息融合与识别任务的实时Turbo解码Viterbi算法;随后展示多模态信息融合的仿真结果;最后证明我们的Turbo FBA与Turbo Viterbi算法同样适用于采用两种声学特征提取方法的单通道多模型识别任务。在包含拼写挑战的小词汇量任务中,所提出的Turbo ASR方案在所有信噪比条件和噪声类型下均超越最佳参考系统——音频-视觉任务平均相对词错误率(WER)降低22.4%,纯音频任务降低18.2%。
关键词: 鲁棒性、语音识别、多媒体系统、迭代解码、隐马尔可夫模型
更新于2025-09-16 10:30:52