聚类有着广泛的应用,但是随着数据规模的不断增长面临挑战。本文关注k-center and k-median聚类问题,设计了在MapReduce编程模型上的聚类算法。该算法使用抽样来减少数据大小,在结果数据集上使用了局部搜索和Lloyd’s算法。