学报首页    
学报动态        
· 重要声明:长春理工大学学报投稿邮箱为custlxb@cust.edu.cn
更多>>
投稿指南        
相关下载        
· 文章模板
· 版面费办理办法
· 保密审查表
更多>>
友情链接        
· 长春理工大学
· 长春理工大学图书馆
· 中国知网
当前位置:首页»自然学科» 当期目录

一种高效的基于初始聚类中心优化的K-means算法

发布日期:2014-07-08| 阅读次数: | 关键字:38-4 | 作者:张晓倩,曲福恒,杨勇,才华,梁鲜 | 来源:长春理工大学学报:自然科学版 2015 Vol.38(4): 154-158

一种高效的基于初始聚类中心优化的K-means算法

张晓倩,曲福恒,杨勇,才华,梁鲜

(长春理工大学 计算机科学技术学院,长春130022

摘要:为解决传统K-means 算法初始质心的随机选取以及聚类过程中每个数据样本到聚类中心距离的重复计算问题,提出了一种高效的基于初始聚类中心优化的K-means 算法,采用最小方差优化初始质心,通过存储每次迭代中所有数据点的簇标志和到最近聚类中心的距离并用于下一次迭代,避免了重复计算数据点到每个中心的距离。在UCI 数据库中五个不同的数据集上进行了测试,对各个算法在聚类准则函数,运行时间以及迭代次数上进行实验结果比较,表明在不降低聚类性能的前提下,减少了迭代次数,缩短了聚类时间,证明了改进算法的有效性和高效性。

关键词:K-means算法;方差;初始聚类中心;距离;时间

中图分类号: TP391 文献标识码:A 文章编号:1672-9870201503-0154-05

 

An Efficient K-means Algorithm Based on

Optimizing Initial Cluster Centers

ZHANG XiaoqianQU FuhengYANG YongCAI HuaLIANG Xian

School of Computer Science and TechnologyChangchun University of Science and TechnologyChangchun 130022

AbstractThe traditional K-means algorithm which AbstractThe traditional K-means algorithm which randomly chosen initial centers and cluster each data sample to the cluster center distance of double counting problem in order to solve this question this paper proposes an efficient k-means algorithm based on optimizing initial cluster centersthe algorithm uses the minimum deviation initial cluster centersby store the labels of cluster and the distance of all the date objects to the nearest cluster during the each iterationwhich is to be used in the next iterationthe improved method avoids computing the distance of each data object to the cluster centers repeatly.Tested on the UCI database of five different data sets the various algorithms in clustering criterion functionrunning time and number of iterations are comparedthe experimental results show that under the premise of without affecting the clustering results shortening  the time of clustering prove the effectiveness and efficiency of the improved algorithm.

Key wordsK-means algorithmdeviationinitialized clustering centersdistancetime

 

作者简介:张晓倩(1990-),女,硕士研究生,E-mail1015261824@qq.com

通讯作者:曲福恒(1977-),男,博士,副教授,E-mailqufuheng@163.com

版权所有:长春理工大学学报编辑部
Copyright ©Changchun University of Science and Technology