ImageVerifierCode 换一换
格式:PPTX , 页数:39 ,大小:1.25MB ,
资源ID:5457499      下载积分:5 金币
验证码下载
登录下载
邮箱/手机:
图形码:
验证码: 获取验证码
温馨提示:
支付成功后,系统会自动生成账号(用户名为邮箱或者手机号,密码是验证码),方便下次登录下载和查询订单;
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

开通VIP
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.zixin.com.cn/docdown/5457499.html】到电脑端继续下载(重复下载【60天内】不扣币)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

开通VIP折扣优惠下载文档

            查看会员权益                  [ 下载后找不到文档?]

填表反馈(24小时):  下载求助     关注领币    退款申请

开具发票请登录PC端进行申请


权利声明

1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前可先查看【教您几个在下载文档中可以更好的避免被坑】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时联系平台进行协调解决,联系【微信客服】、【QQ客服】,若有其他问题请点击或扫码反馈【服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【版权申诉】”,意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4009-655-100;投诉/维权电话:18658249818。

注意事项

本文(2022年数据挖掘技术介绍(共39张PPT).pptx)为本站上传会员【二***】主动上传,咨信网仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知咨信网(发送邮件至1219186828@qq.com、拔打电话4009-655-100或【 微信客服】、【 QQ客服】),核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载【60天内】不扣币。 服务填表

2022年数据挖掘技术介绍(共39张PPT).pptx

1、数数 据据 挖挖 掘掘 技技 术术 简简 介介 演讲人:钟云飞 Email:2002年7月19日大大 纲纲 什么是数据挖掘什么是数据挖掘 数据挖掘的标准流程:数据挖掘的标准流程:CRISPCRISPDMDM 数据挖掘工具数据挖掘工具SPSS ClementineSPSS Clementine简介简介第一部分:什么是数据挖掘?第一部分:什么是数据挖掘?数据挖掘都干了些什么?数据挖掘都干了些什么?英国电信需要发布一种新的产品,需要通过直邮的方式向客户推荐这种产品。使直邮的回应率提高了100数据挖掘都干了些什么?数据挖掘都干了些什么?GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本。

2、通过数据挖掘的方法使库存成本比原来减少了3.8%数据挖掘都干了些什么?数据挖掘都干了些什么?汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户。营销费用减少了30数据挖掘都干了些什么?数据挖掘都干了些什么?美国国防财务部需要从每年上百万比的军火交易中发现可能存在的欺诈现象。发现可能存在欺诈的交易,进行深入调查,节约了大量的调查成本数据挖掘都干了些什么?数据挖掘都干了些什么?美国国内税务局需要提高对纳税人的服务水平。合理安排税务官的工作,为纳税人提供更迅捷、更准确的服务通过数据挖掘您可以通过数据挖掘您可以发现最有价值的客户通过数据挖掘您可以通过数据挖掘您可以使组合销售更有效率通

3、过数据挖掘您可以通过数据挖掘您可以留住那些最有价值的客户通过数据挖掘您可以通过数据挖掘您可以用更小的成本发现欺诈现象通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。数据挖掘能够帮助你选择正确瞄准潜在目标,向现有的客户提供额外的产品,识别那些准备离开的好客户。什么是数据挖掘什么是数据挖掘电信:流失银行:聚类(细分),交叉销售百货公司/超市:购物篮分析(关联规则)保险:细分,交叉销售,流失(原因分析)信用卡:欺诈探测,细分电子商务:网站日志分析税务部门:偷漏税行为探测警察机关:犯罪行为分析医学:医疗保健数据挖掘应用领域数据挖掘应用领域数据挖掘效益分析数据挖掘效益分析

4、直邮)直邮)(Big Bank&Credit Card Company)目的:发现新客户目的:发现新客户数据挖掘以前数据挖掘以前数据挖掘以后数据挖掘以后差别差别发信的数量发信的数量1,000,000750,000(250,000)成本成本$1,000,000$750,000($250,000)响应的数量响应的数量10,0009,000(1,000)每个响应的毛利每个响应的毛利$125$125$0总毛利总毛利$1,250,000$1,125,000($125,000)净利润净利润$250,000$375,000$125,000建模的费用建模的费用040,000$40,000最终的利润最终的利润

5、250,000$335,000$85,000第二部分:数据挖掘标准流程第二部分:数据挖掘标准流程 CRISP-DM CRISP-DMCRISPCRISPDMDM简介简介 CRISPDM是是CRoss-Industry Standard ProcessData Mining的缩写的缩写 由由SPSS、NCR、Daimler-Benz在在1996年制定年制定 CRISP是当今数据挖掘业界通用流行的标准之一是当今数据挖掘业界通用流行的标准之一 它强调数据挖掘在商业中的应用,解决商业中存在的它强调数据挖掘在商业中的应用,解决商业中存在的问题,而不是把数据挖掘局限在研究领域问题,而不是把数据挖掘局限在

6、研究领域CRISPCRISPDMDM 商业理解商业理解 数据理解数据理解 数据准备数据准备 建立模型建立模型 模型评估模型评估 模型发布模型发布商业理解(商业理解(Business Business Understanding)Understanding)找问题确定商业目标找问题确定商业目标 对现有资源的评估对现有资源的评估 确定问题是否能够通过数据挖掘来解决确定问题是否能够通过数据挖掘来解决 确定数据挖掘的目标确定数据挖掘的目标 制定数据挖掘计划制定数据挖掘计划数据理解数据理解(Data(Data Understanding)Understanding)确定数据挖掘所需要的数据确定数据挖掘所

7、需要的数据 对数据进行描述对数据进行描述 数据的初步探索数据的初步探索 检查数据的质量检查数据的质量Perform the rest on a powerful server.把数据挖掘模型的结果送到相应的管理人员手中Model export高度的扩展性保证对数据库中大量的数据进行挖掘高度的扩展性保证对数据库中大量的数据进行挖掘确定数据挖掘所需要的数据对整个数据挖掘过程的前面步骤进行评估数据挖掘都干了些什么?电子商务:网站日志分析数 据 挖 掘 技 术 简 介英国电信需要发布一种新的产品,需要通过直邮的方式向客户推荐这种产品。通过数据挖掘的方法使库存成本比原来减少了3.税务部门:偷漏税行为探测

8、数据准备数据准备(Data(Data Preparation)Preparation)选择数据选择数据 清理数据清理数据 对数据进行重建对数据进行重建 调整数据格式使之适合建模调整数据格式使之适合建模建立模型(建立模型(Modeling)Modeling)对各个模型进行评价对各个模型进行评价 选择数据挖掘模型选择数据挖掘模型 建立模型建立模型模型评估模型评估(Evaluation)(Evaluation)评估数据挖掘的结果评估数据挖掘的结果 对整个数据挖掘过程的前面步骤进行评估对整个数据挖掘过程的前面步骤进行评估 确定下一步怎么办?是发布模型?还是对数据挖掘过确定下一步怎么办?是发布模型?还是

9、对数据挖掘过程进行进一步的调整,产生新的模型程进行进一步的调整,产生新的模型模型发布(模型发布(DeploymentDeployment)把数据挖掘模型的结果送到相应的管理人员手中把数据挖掘模型的结果送到相应的管理人员手中 对模型进行日常的监测和维护对模型进行日常的监测和维护 定期更新数据挖掘模型定期更新数据挖掘模型第三部分:数据挖掘工具第三部分:数据挖掘工具SPSS ClementineSPSS Clementine简介简介Make a difference with the predictive power of data mining应用应用ClementineClementine达到你

10、数达到你数据挖掘的目标据挖掘的目标 图形化的界面、数据流的形式建立模型,保证了应用图形化的界面、数据流的形式建立模型,保证了应用Clementine进行数据挖掘关注商业更甚于关注技术本进行数据挖掘关注商业更甚于关注技术本身身 开放式的技术是更好的保护您的投资的保障开放式的技术是更好的保护您的投资的保障 高度的扩展性保证对数据库中大量的数据进行挖掘高度的扩展性保证对数据库中大量的数据进行挖掘 业界领先的发布技术使数据挖掘结果更好的传递业界领先的发布技术使数据挖掘结果更好的传递到相应管理人员手中到相应管理人员手中把你的商业经验溶入数据挖把你的商业经验溶入数据挖掘过程是数据挖掘成功的关掘过程是数据挖

11、掘成功的关键键Better Better data mining data mining resultsresults!InsightInsightBusiness Business problemproblem?What What you knowyou know丰富的数据挖掘算法丰富的数据挖掘算法PredictionNeural net,C5.0ClassificationNeural net,C5.0SegmentationKohonen,Kmeans,C5.0AssociationApriori,GRI,Web graphSequenceCaprI,Neural Net,Regress

12、ion与与SPSSSPSS及及AnswerTreeAnswerTree无无缝集成提供更多的算法缝集成提供更多的算法Logistic RegressionDiscriminant AnalysisFactor AnalysisMany more.C&RTCHAIDExhaustive CHAIDQUEST使你在数据仓库上的投使你在数据仓库上的投资得到最大的回报资得到最大的回报SybaseDB2InformixOpenIngressOracleSQL Server+ODBC drivers for others+ODBC socket for native drivers开放的建模性能开放的建模性

13、能在在Clementine中通过中通过CEMI加入新的算法加入新的算法ClementineClementineClementineClementine的系统结构的系统结构的系统结构的系统结构 1.Perform many operations in the database.2.Perform the rest on a powerful server.3.Use the client processor for viewing results.Clementine Server delivers huge Clementine Server delivers huge performance

14、 gainsperformance gainsGenerating a distribution graph995 seconds when processed on the desktop69 seconds when processed on the server19 seconds when pushed back into the database 用更小的成本发现欺诈现象银行:聚类(细分),交叉销售69 seconds when processed on the serverClementine Solution Publisher:领先的模型发布技术通过数据挖掘的方法使库存成本比原

15、来减少了3.Model building模型评估(Evaluation)把数据挖掘模型的结果送到相应的管理人员手中与SPSS及AnswerTree无缝集成提供更多的算法(Big Bank&Credit Card Company)把数据挖掘模型的结果送到相应的管理人员手中数 据 挖 掘 技 术 简 介In-database processing delivers better performance as data sets get larger定期更新数据挖掘模型税务部门:偷漏税行为探测In-database processing delivers better performance In-

16、database processing delivers better performance as data sets get largeras data sets get largerSelecting casesseconds required for millions of records when processed on the server v.in the database电子商务:网站日志分析ClassificationNeural net,C5.Model export演讲人:钟云飞Exhaustive CHAIDModel export用更小的成本发现欺诈现象确定问题是否

17、能够通过数据挖掘来解决第三部分:数据挖掘工具图形化的界面、数据流的形式建立模型,保证了应用Clementine进行数据挖掘关注商业更甚于关注技术本身Discriminant AnalysisClementine Server cuts Clementine Server cuts model building time up to 90%model building time up to 90%Model buildingtime needed for building models on the server as a percentage of the time needed for building the model on the desktopClementine Solution Publisher:Clementine Solution Publisher:领先的模型发布技术领先的模型发布技术领先的模型发布技术领先的模型发布技术Model exportClementine Solution Publisher:model and processingSPSSSPSS为您提供全方位的服务,为您提供全方位的服务,帮助您获得商业成功帮助您获得商业成功 全方位的服务全方位的服务 全球性的公司全球性的公司 与业界领袖的伙伴与业界领袖的伙伴关系关系谢谢大家!谢谢大家!

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服