计算
E步
E步计算X属于某个分布的期望,其中X为数据点,Z表示X属于某个分布的标签,Z=k即表示X属于k这个分布
在 EM 算法的 E 步(期望步)中,Z 属于某个分布的概率通过计算 后验概率 来体现。具体来说,每个数据点 都可能由不同的分布生成,而这些分布对应于不同的混合成分(例如在高斯混合模型中,每个高斯分布就是一个成分)。
如何在计算中体现:
-
模型参数和数据点 :
- 通过观察数据 和当前的模型参数 (包括每个成分的参数,如均值、协方差矩阵、混合系数等),你可以计算每个 属于不同成分的似然函数 ,即在第 个成分下生成 的概率。
-
Z 的后验概率:
- 后验概率 是通过贝叶斯定理计算得到的:
- 是 在第 个成分下的似然,描述了第 个成分生成数据 的可能性。
- 是第 个成分的先验概率,表示从第 个成分生成数据的初始可能性。
- 分母部分是所有成分的加权似然,用来归一化使得后验概率的总和为 1。
-
解释:
- 对每一个数据点 X,我们根据当前模型参数 ,计算其在每个成分下的似然,然后用这些似然和每个成分的先验概率来计算数据点 属于每个成分的后验概率(即 的概率)。
- 这个后验概率 表示给定当前参数估计下,数据点 属于第 个分布的概率。
在这样的基础上,E步所求的期望值为每个X所属分布的表示Z,求对数似然函数,再以Z=k的概率作为其权值进行加权求和
M步
M步就是通过最大化期望Q来更新
公式为
找到一个参数最大化期望Q,更新参数