流形学习 ManifoldLearning

什么是流形学习?

  • 一种用于维数约简的机器学习和模式识别方法,它的主要思想是将高维的数据映射到低维,同时保留数据的某些本质结构特征
  • 流形学习可以被认为是对 PCA 等线性框架的概括,使之对数据中的非线性结构敏感。虽然存在监督的变体,但典型的流形学习问题是无监督的:它从数据本身学习数据的高维结构,而不使用预先确定的分类

流形学习的等距映射(Isomap)算法?

  • 一种流形学习技术,用于发现高维数据中的低维结构。它通过保持数据点之间的测地距离(即沿着数据流行表面的实际距离)来构建低维表示,这与传统的多维尺度分析(MDS)方法有所不同,后者保持的是欧几里得距离

流形学习的局部线性嵌入(Locally Linear Embedding, LLE)?

  • 一种流形学习算法,用于将高维数据映射到低维空间,同时保留数据在局部区域内的线性结构。LLE 的基本思想是每个数据点可以由其邻近点的线性组合来近似表示,这种局部线性关系在降维后的空间中得以保持
  • 修改局部线性嵌入(Modified Locally Linear Embedding, MLLE)是局部线性嵌入(LLE)的一种改进版本,它旨在更好地保留数据点之间的相对距离。MLLE 通过引入一个额外的权重矩阵来调整数据点之间的距离,从而改善降维后的空间中数据点的布局

流形学习的 Hessian 特征映射(Hessian Eigenmaps)?

  • 一种流形学习算法,用于发现高维数据中的低维结构。它通过优化一个带约束的图嵌入问题来工作,该问题考虑了数据点的局部邻域结构,并使用 Hessian 矩阵的特征值和特征向量来计算低维嵌入

流形学习的光谱嵌入 ?

  • 一种流形学习算法,用于将高维数据映射到低维空间,同时尽量保持数据点之间的相似性关系。它利用图论中的谱图理论来构建数据点的低维表示,通常涉及到计算图的拉普拉斯矩阵的特征值和特征向量

流形学习的局部切线空间对齐(Local Tangent Space Alignment, LTSA)?

  • 一种流形学习算法,用于发现高维数据中的低维流形结构。LTSA 的基本思想是将高维数据点映射到低维空间,同时保持每个数据点在其局部邻域内的切线空间结构

流形学习的多维缩放(Multidimensional Scaling, MDS)?

  • 一种用于数据分析和可视化的技术,旨在在低维空间中放置高维数据点,以便数据点之间的相对距离得以保留。MDS 试图找到一个低维表示,使得数据点之间的距离(通常是欧几里得距离)与原始高维数据的距离矩阵尽可能相似

流形学习的 t 分布随机邻域嵌入 (t-SNE)?

  • t 分布随机邻域嵌入(t-Distributed Stochastic Neighbor Embedding, t-SNE)是一种高级的流形学习算法,用于降低数据的维度同时保持数据点的局部结构。它特别适用于高维数据的可视化,因为它能够将高维数据映射到二维或三维空间中,使得相似的数据点在低维空间中彼此靠近,而不相似的数据点则远离