DBSCAN

什么是 DBSCAN?

  • 一种基于密度的空间聚类算法,它能够在具有噪声的数据集中发现任意形状的簇
  • 核心思想是通过数据点的密度来进行聚类。算法中有两个关键的参数:EpsMinPtsEps 是用于确定点之间邻域的距离阈值,而 MinPts 则是在 Eps 邻域内最少点数的阈值,用来决定一个点是否为密集区域的一部分。如果一个点在 Eps 邻域内的点数少于 MinPts,则该点被认为是边缘点或噪声点;如果多于 MinPts,则该点被认为是核心点。DBSCAN 算法从每个核心点开始,将其邻域内的所有直接密度可达的点归为同一个簇,这个过程会不断扩展,直到找到最大的密度相连的点集合为止