MeanShift - 均值偏移
什么是 MeanShift (均值偏移) 算法?
- 是一种基于密度梯度上升的聚类算法,通过迭代寻找数据集中的模式点即局部最大密度区域
均值漂移(Meanshift)运算步骤?
- 初始化:选择一个初始点作为当前位置。
- 计算偏移:在当前点的一定范围内(由半径确定),计算所有点到中心点的偏移向量并求平均,得到均值偏移向量。
- 更新位置:将当前点沿均值偏移向量的方向移动一定距离(步长),新的当前点成为下一次迭代的起始点。
- 重复迭代:不断重复上述过程,直到满足结束条件(如达到最大迭代次数或偏移量小于某个阈值)。
- 核函数的应用:为了考虑不同点之间距离的差异性,引入核函数的概念,使得距离中心点更近的点具有更大的权重。
- 多维空间处理能力:由于使用了核函数,该算法能够在高维特征空间中有效地找到模式点。