随着信息技术的不断进步,如何从海量信息中有效地提取用户感兴趣的知识,已经成为当前数据挖掘的重要研究课题。而聚类作为数据挖掘的重要工具,通过将数据划分成多个类,使得类内数据尽可能相似,而类间数据的相似度尽可能小。从而挖掘类中的难以发现的隐含知识模式,而成为研究热点。聚类算法中K-means因为其简单、快速,常常被人们采用,但是K-means算法也存在对初始值敏感,容易被离群点影响聚类结果等缺点。本文提出了一种基于簇误差加权的CVWK-means算法,通过对误差大的簇进行加权处理提升聚类效果。实验结果表明,本文所提算法较原始K-means算法有更好的聚类效果。