马尔可夫链(Markov Chain)是指数学中具有马尔可夫性质的离散事件随机过程。该过程中,在给定当前知识或信息的情况下,过去(即当前以前的历史状态)对于预测将来(即当前以后的未来状态)是无关的。
很多情况下,事物之间的相互联系并不能用一条链来串起来,很可能是交叉的、错综复杂的。这时候我们就用到了贝叶斯网络。 贝叶斯网络(Bayesian network)亦称“信念网络”(belief network),它借助有向无环图(Directed Acyclic Graph,DAG)来刻画属性之间的依赖关系,并使用条件概率表(Conditional Probability Table,CPT)来描述属性的联合概率分布。 上图是一个描述心血管疾病和成因的简单贝叶斯网络每个圆圈表示一个状态,状态之间的连线表示因果关系。每一个关系有一个描述因果强度的东西,叫可信度(Belief),也就是说贝叶斯网络上的边是有权重的。A和B相连说明,AB有因果关系。ABC相连,AB没有直接的因果关系,但是A会通过B作用C。
若网络结构已知,即属性间的关系已经知道,则贝叶斯网络的学习过程相对简单,只需通过对训练样本“计数”,估计出每个节点的条件概率即可。但是现实情况中,网络结构往往不知道。我们引入“评分函数”(score function)来解决这个问题。 常用的评分函数通常基于信息论转自,此类准则将学校问题看做一个数据压缩任务,学习的目标是找到一个以最短编码长度描述训练数据的模型。此时,编码长度包括了描述模型自身所需的字节长度和使用该模型描述数据所需的字节长度。这就是“最小描述长度”(Minimal Description Length,MDL)准则。 给定训练集 D={x1,x2,...,xm} ,贝叶斯网络 B={G,Θ} 在D上的评分函数可写成:
s(B|D)=f(θ)⋅|B|−LL(B|D) 其中网络G是一个有向无环图,每个节点对应一个属性,若两个属性有直接依赖关系,则它们有一条边连接起来;参数 Θ 定量描述这种依赖关系。|B|是贝叶斯网络中的参数个数, f(θ) 表示每个参数 θ 所需的字节数。推断用联合概率太难,是NP-hard。所以人们用吉布斯采样法(Gibbs sampling)。简单来说就是把基础属性确定然后按照概率随机向上生成结果,重复N次。若某一类出现了C次,则概率就是C/N。
我们把文档-单词举证装置,在分解,就可以得到主题模型~ 这也是个贝叶斯网络;-) 文章:D; 主题:T; 关键词:W
