基于判别性聚类网络的端到端说话人日志系统

  • 打印
  • 收藏
收藏成功


打开文本图片集

0 引言

SD任务是将属于相同说话人的音频样本合并到同一个类中,以时间为索引标注不同说话人在音频中的话音活动位置[1]。SD具有广泛的应用,例如在会议、采访与电话录音的文字记录中区分身份信息[2-3]。传统SD基于聚类算法通过模块化方法实现[4],包含话音活动检测(Speech Activity Detection,SAD)、分段、特征嵌入、聚类和标签分配等步骤。(剩余10028字)

monitor
客服机器人