朴素贝叶斯

    xiaoxiao2021-08-16  193

    朴素贝叶斯

    补充该链接里的东西。这篇博客很完美,我看完这篇博客,不光懂得了朴素贝叶斯是啥玩意,还懂得了原来说的训练就是这么个意思!一个实际的例子让我彻底懂了。 然后推荐下,顺便加点我的理解。(主要是保存下这个链接~~~) http://www.cnblogs.com/leoo2sk/archive/2010/09/17/naive-bayesian-classifier.html

    就拿链接里的“检测SNS社区中不真实账号”的例子来解释这幅图吧。 确定特征属性:找出可以用来区分真实账号与不真实账号的特征属性。 获取训练样本:就是用人工筛选的精度很高的样本作为训练集。 训练:这里是通过对训练集,就是那10000个账号进行概率的计算, 首先算出真实账号与不真实账号发生的概率,就是P(yi)了。然后再算每个属性在真实账号和不真实账号发生的情况下发生的概率,就是那些P(ai|yj)了,算的结果应该是i*j种情况。 到这里训练就算完成了吧,然后用训练出来的这些数据,来套这个公式, 把计算P(xi,yi)这种抽象的计算(计算xxx账号是否是真是账号的概率,没法直接计算)转化利用特征来判断就可以了(没有头像的账号是真实账号吗?没有好友的账号是真实账号吗,显然这样的可以计算概率)。然后那个概率大就把x归为哪一类。 结束。

    所以说,在大多数情况下,特征属性越多,训练集越丰富,训练出来的结果越正确!

    转载请注明原文地址: https://ju.6miu.com/read-676453.html

    最新回复(0)