开放场景下短时语音说话人识别系统的优化设计

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要 为适应开放场景下说话人识别短时语音的应用需要,本文对说话人识别模型进行优化,提升了模型的准确率和鲁棒性.为了实现对重要频率特征的筛选,提出基于重加权的特征增强层及网络,起到增强特征表达的作用.将人脸识别领域的误分类样本损失函数首次引入到说话人识别领域,提高对困难样本的挖掘能力.提出基于误分类样(剩余11645字)

monitor
客服机器人