关于K-Means聚类算法的,论文里都说:K-Means算法对数据输入顺序敏感....

李老根记 发布于 2021-09-15
阅读 84K+
收藏
新津东方
新津东方

当然是敏感的,跟程序中如何处理有很大的关系.比如两个中心点(-1,0)(1,0),这时读入(0,0),那么程序计算与所有中心点的距离,因为距离相同,程序会给其中一个,至于给哪个,都是由程序决定,一般按存储的先后顺序来给.而且结果不同不能代表聚类结果差,而是说明结果的多样化,本身K的选取就是没有一个约定的方法,所以结果有差别也是理所当然的.关键是你要如何体现你的算法的优越性.就是要跟别的算法作比较,比如从算法的空间、时间复杂度,算法的运行处理速度等等因素来做比较.