收藏 分销(赏)

Clementine12.0操作PPT学习课件.ppt

上传人:丰**** 文档编号:5460704 上传时间:2024-11-07 格式:PPT 页数:75 大小:2.44MB 下载积分:16 金币
下载 相关 举报
Clementine12.0操作PPT学习课件.ppt_第1页
第1页 / 共75页
Clementine12.0操作PPT学习课件.ppt_第2页
第2页 / 共75页


点击查看更多>>
资源描述
2011 MERIT.All Rights Reserved.MERIT&its logo,are trademarks of MERIT.智慧数据 财富未来Clementine 12.0Clementine 12.0使用指导使用指导 2014年4月14日西安交大-美林数据挖掘研究中心智慧数据 财富未来目录22ClementineClementineClementineClementine建模指导建模指导建模指导建模指导二二二二总体介绍总体介绍总体介绍总体介绍一一一一智慧数据 财富未来公司在大数据领域业务方向23总体介绍Clementine的操作与数据分析的一般流程相吻合,包括数据收集,数据展示和预处理、模型建立、模型评价等环节,Clementine形象地将这些环节表示成若干节点,将数据分析过程看成数据在各个节点之间的流动,并通过一个图形化的“数据流”直观表示整个数据分析过程。成功安装并启动Clementine后会出现主窗口,Clementine主窗口由数据流编辑区和三个窗口组成。数据流编辑区域流管理窗口节点工具箱窗口项目管理窗口智慧数据 财富未来公司在大数据领域业务方向24总体介绍1.数据流编辑区域:建立和编辑Clementine数据流的区域。2.节点工具箱窗口:数据流是由多个节点组成,工具箱中分类存放Clementine的所有节点工具。这些节点均以图标形式显示,可实现数据采集、数据展示、数据(包括变量和样本)预处理、数据建模以及模型评价等功能。它们被分别放置在Source、Record Ops、Field Ops、Graphs、Modeling、Output和Export选项中,其中常用节点集中放置在Favorites选项卡中。呈黄色背景显示的选项卡为当前选项卡。3.流管理窗口:由Streams、Outputs、Model三张选项卡组成。可在Streams选项卡中新建、打开、关闭、保存数据流。Outputs选项卡中存放着执行数据流后生成的各种数据表,Models选项卡中存放着执行数据流后生成的各种模型计算结果。4.项目管理窗口:多条数据流可组成一个数据挖掘项目。当数据挖掘任务较庞大而建立了很多数据流时,可自行将流管理窗口中的服务于不同目标的数据流,分别存放到不同目录中。智慧数据 财富未来公司在大数据领域业务方向25总体介绍数据流的操作主要包括以下四个方面:1)选择和管理节点。2)节点连接和连接调整。3)设置节点参数。4)执行数据流。下图为一个简单的数据流,有向线段表示数据的流动方向。智慧数据 财富未来公司在大数据领域业务方向26总体介绍1.选择和管理节点。由于节点所实现的功能不同,因此被放置在不同的选项卡中。建立数据流时,根据实际需要,首先通过鼠标单击选择相应的选项卡,然后再通过鼠标双击或鼠标拖动操作,将某个节点工具选中并添加到数据流编辑区域中。包含如下选项卡:l收藏(Favorites)选项卡:存放数据流建立过程工程中最常用的节点工具。l数据源(Sources)选项卡:存放将各种外部数据读到Clementine中的节点工具。l记录(Record Ops)选项卡:存放针对记录操作的节点工具。通常,数据以行为单位组织,每一行为一条数据。数据库中称为记录,统计上称为样本。智慧数据 财富未来公司在大数据领域业务方向27总体介绍l字段(Field Ops)选项卡:存放针对字段操作的节点工具。数据库中称列为字段,统计上称为变量。l图形(Graphs)选项卡:存放展示数据分布特征和变量关系规律的可视化图形节点工具。l建模(Modeling)选项卡:存放建立各种数据模型的节点工具。l输出(Outputs)选项卡:存放展示数据和数据基本统计特征的节点工具。l导出(Export)选项卡:存放将数据转换成其他格式的节点工具。智慧数据 财富未来公司在大数据领域业务方向28总体介绍2.节点连接和连接调整。当数据流编辑区域中有两个节点A、B时,可通过有向线段实现A、B的连接。最方便的方法是鼠标右击节点A,按快捷键F2,指定将第一节点A和第二节点B相连。删除节点A、B之间的连接。鼠标右击相应的有向线段,选择弹出菜单中的Delete Connection选项。3.设置节点参数。节点是用来处理数据的,需要对某些节点针对数据处理的方式设置参数。双击相应节点,或者右击相应节点,选择弹出菜单中的Edit即可。4.执行数据流。当数据流建立完成后,若要得到数据分析结果,则需要执行数据流。选择主菜单Tools-Execute,或右击会得结果的节点,选择弹出菜单中的Execute。智慧数据 财富未来公司在大数据领域业务方向29总体介绍常用节点工具l数据源(Sources)选项卡中的Var.File节点、Excel节点。Var.File节点可读入自由格式的文本文件,最常见的为”.csv”和“txt”文件;Excel节点读入的数据格式为“.xls”。l记录(Record Ops)选项卡中的Select节点、Merge节点、Append节点。Select节点通过表达式设置筛选条件;Merge节点和Append节点对多个数据源进行合并。l字段(Field Ops)选项卡中的Type节点、Filter节点、Derive节点、Partition节点。Type节点可指定变量的角色(输入、输出等);Filter节点过滤掉一些后续分析不需要的变量;Derive节点对已经存在的变量,通过给定一些计算公式等生成新的变量;Partition节点对样本进行分割,如将样本分为训练集合测试集。l图形(Graphs)选项卡中的Plot节点和Multiplot节点。Plot节点指定X和Y轴的变量(每个坐标轴只能指定一个变量),描画相应的散点图;Multiplot节点指定X和Y轴的变量,Y轴变量可以是多个,描画相应的折线图。智慧数据 财富未来公司在大数据领域业务方向210总体介绍l建模(Modeling)选项卡中比较常用的节点如下:聚类:分类:回归:关联:时间序列:l输出(Outputs)选项卡中的Table节点、Analysis节点。Table节点以表格的形式展示数据分析的结果、Analysis节点对模型性能进行分析。智慧数据 财富未来目录211ClementineClementineClementineClementine建模指导建模指导建模指导建模指导二二二二总体介绍总体介绍总体介绍总体介绍一一一一智慧数据 财富未来公司在大数据领域业务方向212建模指导-分类Clementine应用:分类 案例根据汽车的购买量、保养情况、车门数、座位数、底盘和安全性对汽车进行分类智慧数据 财富未来公司在大数据领域业务方向213建模指导-分类样本数据智慧数据 财富未来公司在大数据领域业务方向214建模指导-分类输入项:购买量、保养情况、车门数、座位数、底盘、安全性输出项:汽车类别 智慧数据 财富未来公司在大数据领域业务方向215建模指导-分类第一步:导入数据智慧数据 财富未来公司在大数据领域业务方向216建模指导-分类第二步:创建流智慧数据 财富未来公司在大数据领域业务方向217建模指导-分类第三步:设置参数智慧数据 财富未来公司在大数据领域业务方向218建模指导-分类第四步:生成模型智慧数据 财富未来公司在大数据领域业务方向219建模指导-分类智慧数据 财富未来公司在大数据领域业务方向220建模指导-分类第五步:查看结果智慧数据 财富未来公司在大数据领域业务方向221建模指导-分类智慧数据 财富未来公司在大数据领域业务方向222建模指导-分类智慧数据 财富未来公司在大数据领域业务方向223建模指导-分类智慧数据 财富未来公司在大数据领域业务方向224建模指导-分类累计收益图。智慧数据 财富未来公司在大数据领域业务方向225建模指导-聚类Clementine应用:聚类 案例根据花萼和花瓣的长度、宽度来对花进行聚类智慧数据 财富未来公司在大数据领域业务方向226建模指导-聚类样本数据智慧数据 财富未来公司在大数据领域业务方向227建模指导-聚类输入项:花萼长度、花萼宽度、花瓣长度、花瓣宽度智慧数据 财富未来公司在大数据领域业务方向228建模指导-聚类第一步:导入数据智慧数据 财富未来公司在大数据领域业务方向229建模指导-聚类第二步:创建流智慧数据 财富未来公司在大数据领域业务方向230建模指导-聚类第三步:设置参数智慧数据 财富未来公司在大数据领域业务方向231建模指导-聚类智慧数据 财富未来公司在大数据领域业务方向232建模指导-聚类第四步:生成模型智慧数据 财富未来公司在大数据领域业务方向233建模指导-聚类智慧数据 财富未来公司在大数据领域业务方向234建模指导-聚类第五步:查看结果智慧数据 财富未来公司在大数据领域业务方向235建模指导-聚类智慧数据 财富未来公司在大数据领域业务方向236建模指导-聚类智慧数据 财富未来公司在大数据领域业务方向237建模指导-聚类智慧数据 财富未来公司在大数据领域业务方向238建模指导-回归Clementine应用:回归 案例评估CPU性能指标,抽取了最小主内存,缓存大小等与cpu性能相关的7个指标智慧数据 财富未来公司在大数据领域业务方向239建模指导-回归样本数据智慧数据 财富未来公司在大数据领域业务方向240建模指导-回归输入指标:MYCT、MMIN、MMAX、CACH、CHMIN、CHMAX 输出指标:Class智慧数据 财富未来公司在大数据领域业务方向241建模指导-回归第一步:导入数据智慧数据 财富未来公司在大数据领域业务方向242建模指导-回归第二步:创建流智慧数据 财富未来公司在大数据领域业务方向243建模指导-回归第三步:设置参数智慧数据 财富未来公司在大数据领域业务方向244建模指导-回归智慧数据 财富未来公司在大数据领域业务方向245建模指导-回归第四步:生成模型智慧数据 财富未来公司在大数据领域业务方向246建模指导-回归智慧数据 财富未来公司在大数据领域业务方向247建模指导-回归第五步:查看结果智慧数据 财富未来公司在大数据领域业务方向248建模指导-回归智慧数据 财富未来公司在大数据领域业务方向249建模指导-回归智慧数据 财富未来公司在大数据领域业务方向250建模指导-回归智慧数据 财富未来公司在大数据领域业务方向251建模指导-关联Clementine应用:关联 案例对某超市顾客购买商品之间的关联性进行分析智慧数据 财富未来公司在大数据领域业务方向252建模指导-关联样本数据智慧数据 财富未来公司在大数据领域业务方向253建模指导-关联输入和输出变量:fruitveg、freshmeat、dairy、cannedveg、cannedmeat、frozenmeal、beer、wine、softdrink、fish confectionery智慧数据 财富未来公司在大数据领域业务方向254建模指导-关联第一步:导入数据智慧数据 财富未来公司在大数据领域业务方向255建模指导-关联第二步:创建流智慧数据 财富未来公司在大数据领域业务方向256建模指导-关联第三步:设置参数智慧数据 财富未来公司在大数据领域业务方向257建模指导-关联第四步:生成模型智慧数据 财富未来公司在大数据领域业务方向258建模指导-关联智慧数据 财富未来公司在大数据领域业务方向259建模指导-关联第五步:查看结果智慧数据 财富未来公司在大数据领域业务方向260建模指导-时间序列Clementine应用:时间序列 案例现有某企业151个连续生产数据,利用这些数据预测下几期的生产数据智慧数据 财富未来公司在大数据领域业务方向261建模指导-时间序列样本数据智慧数据 财富未来公司在大数据领域业务方向262建模指导-时间序列输出变量:生产数据智慧数据 财富未来公司在大数据领域业务方向263建模指导-时间序列第一步:导入数据智慧数据 财富未来公司在大数据领域业务方向264建模指导-时间序列第二步:创建流智慧数据 财富未来公司在大数据领域业务方向265建模指导-时间序列第三步:设置参数智慧数据 财富未来公司在大数据领域业务方向266建模指导-时间序列智慧数据 财富未来公司在大数据领域业务方向267建模指导-时间序列第四步:生成模型智慧数据 财富未来公司在大数据领域业务方向268建模指导-时间序列智慧数据 财富未来公司在大数据领域业务方向269建模指导-时间序列第五步:查看结果智慧数据 财富未来公司在大数据领域业务方向270建模指导-时间序列智慧数据 财富未来公司在大数据领域业务方向271建模指导-时间序列智慧数据 财富未来公司在大数据领域业务方向272建模指导-时间序列智慧数据 财富未来公司在大数据领域业务方向273建模指导-时间序列智慧数据 财富未来考核开始时间:培训完毕后两周内考核方式:试卷答题实际操作参考帮助中的Application Example要求:将构建数据挖掘流过程“数据源”、“属性选择”、“因变量选择”、“模型构建”、“模型评估”5个环节进行截图,并整理到word文档中;答卷及实际操作最终提交时间最迟于5月5日18:00前提交,逾期按零分计算。742024/11/7 周四智慧数据 财富未来 谢谢!谢谢!
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2026 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服