1、数据仓库与数据挖掘实验报告2学号:姓名:班级:实验名称:apriori算法应用实验地点:所使用的工具软件及环境:一、 实验目的:1 通过本实验,了解如何使用clementine环境2、学会对简单的数据进行处理与显示实验内容(I):数据如下:ABCDE1111001101101010101111110要求:1用excel格式导入数据,并显示数据。2使用apriori方法找到数据在不同的参数下的信任度与支持度 并用截图形势进行表示。3用web节点方法调节不同的参数环境,给出各数据属性之间的关 联度。4所有的重要步骤都要进行屏幕截图,并配以文字说明。5本例实际为上课教材70页表3-1变形。实验内容(
2、2):关联分析、决策树重要步骤,并以截图形式说明。第一步:关联分析要求:1.用自由格式读取Demo文件夹下的文件BASKETS In,2 .接入type结点,点击read values读取数据,去掉一些与关联 分析(即对购买商品关联分析)没有用的个人信息数据。3 .添加叩riori模型,取默认值.查看关联分析结果,并给对结论给出解释。4 .用web节点方法调节不同的参数环境,给出各数据属性之间的 关联度,并给对结论给出解释。第二步:决策树分析要求:1.用自由格式读取Dem。文件夹下的文件BASKETSln,5 .接入type结点,点击read values读取数据,去掉一些与关联 分析(即对购
3、买商品关联分析)没有用的个人信息数据。6 .添加Derive节点,并重新命名该节点名称为health, Derive as 选择 Flag, True value :为 T , False value 为 F,后单击该界面类似计算器图标的公式编辑器,在其内容里面写fruitveg =7,and fish =,T, 后点击check进行检查是否有语法 错误,如果没有点击ok.在Derive节点后增加table节点,查看增加的health列内容。 (注释:health列可理解为健康食品购买者)7 .去掉table节点,增加type节点,点击读入数据read values,把 客户的个人信息(value pmethod sex homeown income age)的 Direction歹!J设置成in, health的Direction列设置成out,其他的 Direction列信息全部设置为none。8 在type节点后增加决策树模型C5.0,决策树进行不剪枝设置, 运行生成决策树lo对生成的决策树进行分析。9 对生成的决策树进行剪枝,生成决策树2。10 分别对生成的模型(决策树1和决策树2)后添加Analysis节点, 来对剪枝后的决策树进行分析,来确定是否可以剪枝成决策树2, 给出自己的理由。四、操作步骤五、 实验结果任课教师:*成绩: