K-均值算法的初始化改进与聚类质量评估

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要 为解决K-均值算法随机初始化的问题,提出了相应的改进方案。通过特征标准化和主成分分析(principal component analysis,PCA)实现数据降维;以最远质心和最小-最大距离规则确定算法的初始质心。为获得数据固有的聚类数量,采用经验法则和肘部法,并用轮廓分析评价聚类质量。仿真结果表明:其他算法平均的SymbollA@ 检验统计量是本方案的2.72倍,而且改进后的聚类误差下降了6.04%。(剩余16087字)

monitor
客服机器人