聚类是无监督学习的一个重要方法,聚类是将样本集D划分为若干互不相交的子集,即样本簇。聚类的思想就是把属性相似的样本归到一类。对于每一个数据点,我们可以把它归到一个特定的类,同时每个类之间的所有数据点在某种程度上有着共性,使得簇内相似度高且簇间相似度低。本文是基于鸢尾花数据集进行了三种不同聚类算法的实现。首先导入了鸢尾花数据集;其次对数据集进行降维处理,将处理后的数据集选取不同的k值,进行三种不同聚类,分别是基于划分的K-Means聚类、基于密度的DBSCAN聚类和基于层次的AGNES聚类,然后通过python编码实现聚类;最后将结果进行可视化,将评价指标进行量化。将由聚类结果分析,当k=3是与实际意义相符的,同时,不同的聚类方法在对同一数据集进行聚类时,会得到不同的聚类效果,对于不同的评价指标又各有优势。