1.使用分类器预测未知数据
----->首先使用J48分类器对天气数据集进行训练,得到如下图所示的决策树
----->其次使用记事本,自己构建一个测试数据集
@relation weather.symbolic @attribute outlook {sunny,overcast,rainy} @attribute temperature {hot,mild,cool} @attribute humidity {high,normal} @attribute windy {TRUE,FALSE} @attribute play {yes,no} @data rainy,cool,high,FALSE,yes ------再分类器面板的子面板,选择Supplied test set 作为测试策略,单击Set-->Open file-->打开刚才编辑的数据集文件,在More option中选择Plain Text选项,使得分类器的输出信息中包含预测信息
----->准备就绪后,Start开始启动分类器训练和评估过程,探索者在分类器输出区域输出性能统计信息。
------>红线区域即是训练数据集的预测结果,表明测试集仅有一个实例,预测值和实际值都为yes,预测没有错误。
2.使用决策规则训练天气数据集,并评估分类器性能
----->导入天气数据集,选择rules条目下的JRip分类器,按Start启动训练,训练结果如下:
----->如图所示,每条规则用"----->"分开规则前件和规则后件,规则后件有用括号引起的两个数字,第一个数字表示规则覆盖的实例数量,第二个数字表示错分的实例数量。
------>同样也可以可视化分类错误
----->在该窗口中拉动Jitter滑条,会错开一些叠加的实例。在分类错误散点图中,左上角和右下角的小方块都是正确分类的实例。左下角 的小蓝叉和右上角的小红叉都是错分的实例,可视化能直观看到错分实例的数量。