机器学习聚类算法

云 石油云

机器学习聚类算法

聚类分析又称群分析，是研究（样品或指标）分类问题的一种统计分析方法，同时也是数据挖掘的一种重要的无监督算法，能够挖掘数据之间的内在性质和规律，可以将数据点归结为一系列特定的组合。理论上归为一类的数据点具有相同的特性，而不同类别的数据点则具有各不相同的属性（物以类聚，人以群分）。在数据科学中聚类会从数据中发掘出很多分析和理解的视角，让我们更深入的把握数据资源的价值、并据此指导生产生活。

计算步骤

① 导入数据准备：

导入的数据要求为txt，每行上的数据都以“，”隔开，导入数据格式如图1：

图1 导入数据格式

② 导入数据

点击“导入数据”，导入txt格式的数据。导入前如图2：

图2 数据导入前界面

数据导入后界面如图3所示：

图3 数据导入界面

数据导入后可以看到成功导入数据的行数，点击“+”可以查看，如图4：

图4 查看导入数据界面

③ 选择聚类算法

选择聚类算法如图5所示

图5 聚类算法选择图

④ 点击“聚类”，得到识别结果如图6：

图6 识别结果显示

⑤ 导出

点击“导出数据”，可导出数据对应的标签。同时，也可通过导入界面查看标签输出情况，如下图所示：

	数据(以逗号分隔)	标签
1.

导入数据

聚类算法:

投影子空间的维数:

识别结果:

#	结果	耗时(单位毫秒)
1.