计算

E步

E步计算X属于某个分布的期望,其中X为数据点,Z表示X属于某个分布的标签,Z=k即表示X属于k这个分布

在 EM 算法的 E 步(期望步)中,Z 属于某个分布的概率通过计算 后验概率 来体现。具体来说,每个数据点 都可能由不同的分布生成,而这些分布对应于不同的混合成分(例如在高斯混合模型中,每个高斯分布就是一个成分)。

如何在计算中体现:

  1. 模型参数和数据点

    • 通过观察数据 和当前的模型参数 (包括每个成分的参数,如均值、协方差矩阵、混合系数等),你可以计算每个 属于不同成分的似然函数 ,即在第 个成分下生成 的概率。
  2. Z 的后验概率

    • 后验概率 是通过贝叶斯定理计算得到的:
    • 在第 个成分下的似然,描述了第 个成分生成数据 的可能性。
    • 是第 个成分的先验概率,表示从第 个成分生成数据的初始可能性。
    • 分母部分是所有成分的加权似然,用来归一化使得后验概率的总和为 1。
  3. 解释

    • 对每一个数据点 X,我们根据当前模型参数 ,计算其在每个成分下的似然,然后用这些似然和每个成分的先验概率来计算数据点 属于每个成分的后验概率(即 的概率)。
    • 这个后验概率 表示给定当前参数估计下,数据点 属于第 个分布的概率。

在这样的基础上,E步所求的期望值为每个X所属分布的表示Z,求对数似然函数,再以Z=k的概率作为其权值进行加权求和

M步

M步就是通过最大化期望Q来更新

公式为

找到一个参数最大化期望Q,更新参数