本文通过改进通过方差和马哈拉诺比斯距离测量距离的方式,介绍了高斯混合模型作为 k-Means 的自然扩展。 GMM 不是将点分配给具有硬边界的簇,而是使用通过期望最大化算法(劳埃德方法的一般形式)学习的概率。
使用简单的 Excel 公式,我们在 1D 和 2D 中逐步实现 EM,并可视化高斯曲线或椭圆在训练过程中如何移动。均值发生变化,方差发生调整,形状逐渐围绕数据的真实结构稳定下来。
GMM 提供了一种更丰富、更灵活的集群建模方式,一旦该过程在电子表格中可见,它就会变得直观。
帖子机器学习“降临日历”第 5 天:Excel 中的 GMM 首先出现在走向数据科学。