收藏 分销(赏)

SPSS神经网络.pptx

上传人:精**** 文档编号:12638481 上传时间:2025-11-18 格式:PPTX 页数:81 大小:2.34MB 下载积分:18 金币
下载 相关 举报
SPSS神经网络.pptx_第1页
第1页 / 共81页
SPSS神经网络.pptx_第2页
第2页 / 共81页


点击查看更多>>
资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2014/6/18,#,SPSS,神经网络,神经网络,神经网络是一个非线性的数据建模工具集合,它包括,输入层,和,输出层,、一个或者多个,隐藏层,。,神经元,之间的连接赋予相关的权重,,训练算法,在迭代过程中不断调整这些权重,从而使得,预测误差最小化,并给出预测精度,。,您,可以设置网络的训练条件,从而控制训练的停止条件以及网络结构,或者让算法自动选择最优的,网络结构,。,发展历史,人工神经网络,ANN,简称为神经网络,Artificial Neural Networks,是以计算机网络系统模拟生物神经网络的智能计算系统,是对人脑或自然神经网络的若干基本特性的抽象和模拟。,网络上的每个结点相当于一个神经元,可以记忆、处理一定的信息,并与其他结点并行工作。,起源于,20,世纪,40,年代心理学家和数学家共同提出,90,年代以来与模糊技术、遗传算法、进化计算等智能方法结合方向发展。,神经网络,在许多领域,,都,可以,将神经网络,和,其他统计分析结合,起来,获得更深入、清晰的洞察力,。,例如在,市场研究领域,,可以,建立客户档案发现客户的偏好;在数据库,营销领域,,可以,进行客户细分,优化市场活动的响应。,在,金融分析,方面,,可用神经网络,分析申请人的信用状况,探测可能的欺诈。在,运营分析,方面,,也可以管理,现金流、优化供应链。此外,在科学和,医疗方面,的应用包括预测医疗费用、医疗结果分析、预测住院时间等。,神经网络,SPSS,神经网络,包括,多层感知器,(,MLP,)或者,径向基函数,(,RBF,)两种方法,。,都是,有监督的学习技术,即都根据,输入的数据映射出关系,。都,采用前馈结构,,即数据,从一个方向进入,通过输入节点、隐藏层最后进入输出节点,。,对,过程的选择,受输入数据,的类型和网络的复杂,程度影响,。此外,,,MLP,可以发现更复杂的关系,径向基函数,RBF,的速度更快。,区别,感知器特别适合简单的模式分类问题,通过对权值的,训练,,可以使感知器神经元的输出能代表对输入模式进行,分类,。,感知器的学习规则主要通过调整网络层的,权值和阙值,以便对输入向量进行正确归类;训练规则则通过仿真和训练得到,最优的权值和阙值,。,基于局部逼近网络的径向基函数只需对,少量,权值进行调整,所以该法在逼近能力、分类能力和学习速度上,优于,全局逼近网络。,数据库,多层感知器实例分析,缺失值,150,,即为潜在客户群,首先,产生随机数,来选择样本数据集,转换(,Transform,),-,随机数生成器(,Random Number Generators,),设置起点(,Set Starting Point,),-,选中固定值(,Fixed Value,),-,填入,9191972,确定(,OK,)。,多层感知器实例分析,多层感知器实例分析,将创建分区变量,,用于精确的重新创建哪些用于分析的样本;,转换,-,计算变量,在目标变量中填入变量名,partition,,然后在数学表达式填入计算表达式,2*RV.BERNOULLI(0.7)-1,,,用于产生,bernoulli,分布数据,数据集名称为,partition,正值大约占,70%,,为训练样本;,负值大约占,30%,,为保持样本;,0,分配给检验样本,本次没有。,多层感知器实例分析,多层感知器实例分析,分析,-,神经网络,Neural Network-,多层感知器,Multilayer Perceptron,选择变量,Previously Default,到因变量,选择变量,Level education,到因子。,选择变量,age,,,employ,,,address,,,income,,,debtinc,,,creddebt,,,othdebt,到协变量,多层感知器实例分析,单击输出(,Output,)标签,,选择,ROC,曲线,累积增益曲线,增益图,观察预测值,去掉图表,最后选择自变量重要性分析,选项,栏。,单击确定(,OK,)进行分析。,多层感知器实例分析,个案处理摘要显示,499,个分配给训练样本,,201,个分配给保持样本,,150,个为潜在客户群,多层感知器实例分析,结果,单位数,包括协变量和因子的类别数,多层感知器实例分析,因为,达到了最大时程数,,所以估计算法停止。理想情况下应该是因为错误才收敛,这提出了进一步检查的意见。,多层感知器实例分析,总体来说你的模型有,七五成,的正确率。,矫正超额训练,观察到,支持样本,在预测实际拖欠贷款的客户时表现相对较差,支持样本,45.8%,正确;训练样本,59.7%,正确,怀疑网络可能超额训练;其根据随机变化搜寻显示在培训数据中虚假模式,解决方案:,指定一个检验样本来保持网络正常运行,我们可以通过计算变量来分配训练样本中的一部分为检验样本,第二次分析,分析,设置,大于,0,的进行重新分区,使得约,20%,取值为,0,;,80%,的取值为,1,整体上,大约,以前获得过贷款的客户,0.7,*,0.8=,0.56,作为,训练样本,0.7,*,0.2=,0.14,作为,检验样本,原来的,保持样本,还都在,因为达到了,错误未减少,,所以估计算法停止。表明超额训练通过添加一个测试样本得到了解决,分类表使用,0.5,作为界限,过于单一,还需要查看,ROC,曲线。,曲线范围是,ROC,曲线的数字摘要,对于每个类别,表中的值代表了对于该类别中预测拟概率,例如,对于随机选择的拖欠贷款者与随机选择的未拖欠贷款者,就缺省模型而言,,前者高于后者的概率为,0.854.,观察,讲预测分类为,YES,的界限从,0.5,下降到,0.3,大致是第二个箱图的顶端和第四个箱图的低端,可以在不损失大量潜在优质客户的前提下增加准确找到潜在欠贷者的几率,即,第二个箱图从,0.5,移动到,0.3,,则细线处相对较少的未欠贷客户重新预测为欠贷者,而第四个箱图,则大量欠贷客户会被重新正确的分类为预测欠贷者,案例,2,电信数据,telco.sav,电信供应商按照顾客使用习惯将顾客群分为,4,大类,若得到新客户的数据,可以针对每个用户提供个性化服务。,当前,1000,名客户资料,建立相应的神经网络,以判断客户所属的客户群。,首先,产生随机数种子,其次,采用径向基进行分析,分区设置,零模型会把所有客户归到附加服务组,准确率是,0.281,;,RBF,网络获得了,0.374,的准确率,提高了将近,10%,;,实际上对于附加服务和总体服务客户,网络预测较好,其他客户效果较差;,需要找到另外的预测变量来进行分离客户,案例,3,使用多层感知器估计保健成本与住院时间,医院跟踪心肌梗塞治疗的病人的成本与住院时间,获取这些测量有助于管理部门在病人接受治疗时候正确管理现有床位。,准备数据,更改度量方式,输出分析报告,分析,警告,doa,和,der,在训练 样本中为常数。,到达时已死亡或在急救室死亡的患者,我们分析生存时间,所以只包括急救之后存活患者。,个案处理摘要显示,分析中排除的,2002,个案为前往 医院途中或在急救室死亡的患者。,分析,理想的情况下,,值应大致位于由原点出发的,45,度线上,意味着五天内观察的住院时间预测值往往高估了住院时间;而六天以上的观察住院时间往往低估了住院时间;,在图的左下方有一组患者很可能还未做手术,左上方有一组患者,观察住院时间为一至三天,因此预测值过大,很可能是这些个案为在医院手术后死亡的患者。,分析,网络预测的,治疗费用效果似乎很好,,有三组主要患者,左下方主要为未做手术的患者,成本相对较低;,下一组患者治疗成本大约为,$30,000,做过,PTCA,手术的患者;,最后一组治疗成本超过,$40,000,,手术费较高,为,CABG,手术患者,康复时间较长,增加了成本,还有许多成本超过,$50,000,的个案,预测不佳,应该是手术并发症的患者,会增加手术成本和住院时间,分析,重要性图显示结果由完成的手术过程控制,随后是否出现并发症,再随后是其他预测值。,网络在为典型患者预测时效果很好,,但是没有手术死亡的患者效果不好,可以创建多个网络。一个网络预测患者结果,是否存活;一个网络预测成本,一个预测住院时间,条件是患者是否存活,
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:0574-28810668  投诉电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服