sklean的默认参数一般效果已经不错了,不过今天碰到一个案例需要手动调一下初始聚类点的情况。
#overduetimes_predicted=KMeans(n_clusters=3).fit(X).predict(X) #不选择初始聚类点的情况
overduetimes_predicted=KMeans(n_clusters=3,n_init=1,init=np.array([[0],[5],[10]])).fit(X).predict(X) #init=np.array,选择聚类中心
另外rapidminer里的kmeans默认参数做的更好,要不是做自动化的情况下用rapidminer出结果更快。
转载请注明原文地址: https://ju.6miu.com/read-9487.html