收藏 分销(赏)

应用统计学数据管理.ppt

上传人:可**** 文档编号:1865017 上传时间:2024-05-10 格式:PPT 页数:90 大小:2.63MB
下载 相关 举报
应用统计学数据管理.ppt_第1页
第1页 / 共90页
应用统计学数据管理.ppt_第2页
第2页 / 共90页
应用统计学数据管理.ppt_第3页
第3页 / 共90页
应用统计学数据管理.ppt_第4页
第4页 / 共90页
应用统计学数据管理.ppt_第5页
第5页 / 共90页
点击查看更多>>
资源描述

1、重庆交通大学管理学院09 五月 2024*数据管理数据管理重庆交通大学管理学院09 五月 2024*v 在在数数据据文文件件建建立立好好之之后后,还还需需要要对对数数据据进进行行必必要要的的加加工工处处理理。对对同同一一个个数数据据往往往往需需要要从从各各种种不不同同的的侧侧面面进进行行研研究究,采采取取多多种种统统计计方方法法进进行行分分析析,而而不不同同的的统统计计方方法法对对数数据据文文件件结结构构的的要要求求不不尽尽相相同同,这这就就需需要要对对数数据据文文件件的的结结构构进进行行重重新新调整或转换,以便适合于相同的统计方法。调整或转换,以便适合于相同的统计方法。数据管理数据管理 文件

2、级别的数据管理文件级别的数据管理 变量级别的数据管理变量级别的数据管理重庆交通大学管理学院09 五月 2024*文件级别的数据管理(文件级别的数据管理(1)v SPSS中中的的Data菜菜单单提提供供了了文文件件级级别别的的数数据据管管理理,可以对整个数据文件进行加工整理。可以对整个数据文件进行加工整理。重庆交通大学管理学院09 五月 2024*Insert Variable:插入变量:插入变量 Insert Cases:插入记录:插入记录 Go to Case:到达某条记录:到达某条记录v 简单命令简单命令(这些功能都可以用鼠标在数据表界面(这些功能都可以用鼠标在数据表界面 直接完成,很少用

3、菜单操作,在此不详述)直接完成,很少用菜单操作,在此不详述)Sort Cases:记录排序:记录排序 Split File:记录拆分:记录拆分 Select Cases:记录筛选:记录筛选 Weight Cases:记录加权:记录加权v 常用的简单过程常用的简单过程(使用频繁,必须掌握)(使用频繁,必须掌握)文件级别的数据管理(文件级别的数据管理(2)重庆交通大学管理学院09 五月 2024*Define Variable Properties:定义数据字典:定义数据字典 Copy Variable Properties:将预定义的数据:将预定义的数据 字典直接引入当前数据文件,即复制外部数据

4、字典直接引入当前数据文件,即复制外部数据 文件属性到当前数据文件文件属性到当前数据文件v 变量与数据文件属性向导变量与数据文件属性向导(对大型或连续性数据(对大型或连续性数据分析项目非常有用)分析项目非常有用)Transpose:数据转置:数据转置 Restructure:数据文件的重新排列:数据文件的重新排列v 数据重构向导数据重构向导文件级别的数据管理(文件级别的数据管理(3)重庆交通大学管理学院09 五月 2024*Add Cases:纵向合并:纵向合并 Add Variable:横向合并:横向合并v 文件合并过程(文件合并过程(Merge Files)Define Dates:定义日期

5、变量过程,用于时间序列数据:定义日期变量过程,用于时间序列数据 Aggregate:数据汇总过程:数据汇总过程 Identify Duplicate Cases:查找重复记录:查找重复记录v 其他过程其他过程文件级别的数据管理(文件级别的数据管理(4)v 正交设计过程(正交设计过程(Orthogonal Design)重庆交通大学管理学院09 五月 2024*单变量排序单变量排序:SPSS提供了一种简易操作方法,提供了一种简易操作方法,即在数据表格的变量名处单击右键,弹出右图即在数据表格的变量名处单击右键,弹出右图多变量排序:多变量排序:使用使用Sort Cases过程来进行,过程来进行,查看

6、详情查看详情记录排序记录排序重庆交通大学管理学院09 五月 2024*记录排序记录排序重庆交通大学管理学院09 五月 2024*选中选中District,选择升序选钮(默认),将,选择升序选钮(默认),将District选入选入Sort by 框框选中选中Region,选择降序选钮,将,选择降序选钮,将Region选入选入Sort by 框框记录排序记录排序重庆交通大学管理学院09 五月 2024*注意:注意:v在多重排序中,指定排序变量名的次序很关键,首先安第在多重排序中,指定排序变量名的次序很关键,首先安第一个变量排序,对于与第一个变量取值相同的记录考虑按一个变量排序,对于与第一个变量取值

7、相同的记录考虑按第二个变量排序第二个变量排序v排序后,原来记录数据的排序将被打乱,对于时间序列数排序后,原来记录数据的排序将被打乱,对于时间序列数据,若未存放有记录标志的变量,应注意保存原数据的排据,若未存放有记录标志的变量,应注意保存原数据的排列顺序,以免数据混乱列顺序,以免数据混乱记录排序记录排序重庆交通大学管理学院09 五月 2024*记录拆分记录拆分重庆交通大学管理学院09 五月 2024*1.1.选中此框不拆分文件选中此框不拆分文件2.2.按所选变量拆分文件,各组分析结果放在一起便于比较按所选变量拆分文件,各组分析结果放在一起便于比较3.3.按所选变量拆分文件,各组分析结果单独放置按

8、所选变量拆分文件,各组分析结果单独放置4.4.用于选择拆分数据文件的变量用于选择拆分数据文件的变量5.5.要求将数据按所用拆分变量排序要求将数据按所用拆分变量排序6.6.数据集很大,且拆分变量已排序,选此可节省运行时间数据集很大,且拆分变量已排序,选此可节省运行时间123456记录拆分记录拆分重庆交通大学管理学院09 五月 2024*记录筛选记录筛选重庆交通大学管理学院09 五月 2024*123451.1.分析所有记录分析所有记录2.2.分析满足条件的记录,分析满足条件的记录,按按IfIf按钮按钮设定筛选条件设定筛选条件3.3.从原数据中按某种条件从原数据中按某种条件抽样,按抽样,按Samp

9、leSample进行设定进行设定4.4.基于时间或记录序号选择基于时间或记录序号选择记录,按记录,按RangeRange进行设定进行设定5.5.使用筛选指示变量选择记录,非使用筛选指示变量选择记录,非0 0值的记录被选中值的记录被选中6.6.未选中的记录被隔离未选中的记录被隔离7.7.未选中的记录被删除未选中的记录被删除67记录筛选记录筛选重庆交通大学管理学院09 五月 2024*记录筛选记录筛选重庆交通大学管理学院09 五月 2024*记录加权记录加权重庆交通大学管理学院09 五月 2024*v 设设置置作作为为权权重重的的变变量量,如如第第一一行行表表示示agecat1 gender1的的

10、人人共共33个,个,accid表示人数,应设为权重表示人数,应设为权重记录加权记录加权重庆交通大学管理学院09 五月 2024*定义数据字典定义数据字典重庆交通大学管理学院09 五月 2024*变量名、测量尺度等变量名、测量尺度等变量列变量列表表频数、标签、频数、标签、缺失值设定等缺失值设定等拷贝变量属性拷贝变量属性自动生成值标签自动生成值标签定义数据字典定义数据字典重庆交通大学管理学院09 五月 2024*数据转置数据转置重庆交通大学管理学院09 五月 2024*v Transpose:该该过过程程用用于于对对数数据据进进行行行行列列转转置置,即即原原来来的的一一条条记记录录转转成成为为一一

11、个个变变量量,而而变变量量则则转转成成为为一一个个记记录录,两两次次Transpose过过程程后后数数据据集集会会恢恢复复原原样样(点点此此见见具体操作)。具体操作)。数据转置数据转置重庆交通大学管理学院09 五月 2024*将变量将变量Group、x选入选入variable框,再点击框,再点击OK键键转置前的数据集转置前的数据集转置后的数据集转置后的数据集v 注:未选中的变量注:未选中的变量id其数据信息在转置后丢失其数据信息在转置后丢失数据转置数据转置重庆交通大学管理学院09 五月 2024*数据文件重新排列数据文件重新排列重庆交通大学管理学院09 五月 2024*Restructure:

12、此过程是用来改变数据的排列格式,即此过程是用来改变数据的排列格式,即长型格式和宽型格式之间的互转。长型格式和宽型格式之间的互转。数据文件重新排列数据文件重新排列重庆交通大学管理学院09 五月 2024*数据文件重新排列数据文件重新排列重庆交通大学管理学院09 五月 2024*v 数据数据anxiety转换前后的长型格式和型格式转换前后的长型格式和型格式数据文件重新排列数据文件重新排列重庆交通大学管理学院09 五月 2024*文件纵向合并文件纵向合并重庆交通大学管理学院09 五月 2024*:当前数据集中的变量:当前数据集中的变量 +:新添加数据集中的变量:新添加数据集中的变量v 左框:新、老数

13、据文件中不匹配的变量名左框:新、老数据文件中不匹配的变量名v 右框:已匹配的变量名,选择完成后单击右框:已匹配的变量名,选择完成后单击OK即可即可 Add Cases:纵向合并,从外部数据文件中增加记录到当前数:纵向合并,从外部数据文件中增加记录到当前数 据文件中,相互合并的数据文件中应该有相同的变量。据文件中,相互合并的数据文件中应该有相同的变量。文件纵向合并文件纵向合并重庆交通大学管理学院09 五月 2024*文件横向合并文件横向合并重庆交通大学管理学院09 五月 2024*1.未被纳入的变量列未被纳入的变量列2.被纳入合并后新数据集的变量列表被纳入合并后新数据集的变量列表3.记录匹配使用

14、的关键变量记录匹配使用的关键变量 Add Variables:横向合并,:横向合并,从外部数据文件增加变量到当从外部数据文件增加变量到当 前数据文件,两个数据集要有一个一一对应的关键变量进前数据文件,两个数据集要有一个一一对应的关键变量进 行匹配合并,且记录应按关键变量升序后再合并。行匹配合并,且记录应按关键变量升序后再合并。123文件横向合并文件横向合并重庆交通大学管理学院09 五月 2024*数据汇总数据汇总重庆交通大学管理学院09 五月 2024*分组变量分组变量被汇总变量被汇总变量数据汇总数据汇总重庆交通大学管理学院09 五月 2024*v 定义汇总函数定义汇总函数 v 定义新产生汇总

15、变量的定义新产生汇总变量的 名称和标签名称和标签FunctionName&Label数据汇总数据汇总重庆交通大学管理学院09 五月 2024*查找重复记录查找重复记录重庆交通大学管理学院09 五月 2024*希望查找重复值的变量希望查找重复值的变量重复记录按该变量的取值排序重复记录按该变量的取值排序设设定定第第一一个个还还是是最最后后一一个重复记录为主记录个重复记录为主记录查找重复记录查找重复记录重庆交通大学管理学院09 五月 2024*v PrimaryLast0表示相应的记录为重复记录表示相应的记录为重复记录查找重复记录查找重复记录重庆交通大学管理学院09 五月 2024*变量级别的数据管

16、理(变量级别的数据管理(1)v SPSS中中的的Transform菜菜单单提提供供了了变变量量级级别别的的数据管理,可以对变量进行操作。数据管理,可以对变量进行操作。重庆交通大学管理学院09 五月 2024*v 计算新变量计算新变量(Compute):最常用):最常用 Recode:对变量值进行分组合并:对变量值进行分组合并 Visual Bander:连续变量的可视化分段:连续变量的可视化分段 Count:表示某个变量的取值中是否出现某个值,或:表示某个变量的取值中是否出现某个值,或 某个区间某个区间 Rank Cases:变量编秩:变量编秩 Automatic Recode:对记录按某个变

17、量值的大小排序:对记录按某个变量值的大小排序v 变量转换变量转换变量级别的数据管理(变量级别的数据管理(2)重庆交通大学管理学院09 五月 2024*Create Time Series:建立时间序列:建立时间序列 Replace Missing Values:缺失值替代:缺失值替代 Random Number Seed:设定随机种子:设定随机种子v 专用过程专用过程变量级别的数据管理(变量级别的数据管理(3)v 控制命令控制命令 Run Pending Transforms:用于执行编程中被:用于执行编程中被 挂起的数据整理操作挂起的数据整理操作专用于时间专用于时间序列模型序列模型重庆交通大

18、学管理学院09 五月 2024*例例1 数数据据fee.sav是是上上海海和和杭杭州州16名名住住院院病病人人的的费费用用数数据据,计计算上海的住院病人平均每天的住院费用,要求结果取整。算上海的住院病人平均每天的住院费用,要求结果取整。计算新变量计算新变量重庆交通大学管理学院09 五月 2024*输入新变量名输入新变量名perfee计算新变量计算新变量重庆交通大学管理学院09 五月 2024*计算新变量计算新变量输入条件表达式输入条件表达式重庆交通大学管理学院09 五月 2024*计算新变量计算新变量选选择择函函数数输入函数表达式输入函数表达式重庆交通大学管理学院09 五月 2024*计算新变

19、量计算新变量重庆交通大学管理学院09 五月 2024*例例2 在在数数据据fee.sav中中生生成成新新变变量量grade,当当住住院院总总费费用用小小于于5000元元时时取取值值为为“相相对对较较低低”,大大于于等等于于5000元元且且小小于于7000元元取取值值为为“中中等等”,大大于于等等于于7000元元且且小小于于10000元元为为“较较高高”,大大于等于于等于10000元为元为“很高很高”。变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*新变量名新变量名grade选入原变量选入原变量totaltotal变量值分组合并变量值分组合并重庆交通大学管理学院09 五月

20、2024*变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*v 三三种种Range的的设设置置,所所有有的的范范围围均均包包含含了了端端点点,而而前前面面设设定定的的变变换换会会优优于于后后面面的的变变换换,因因此此应应该该将将大大于于等等于于10000元最先设定,而将小于元最先设定,而将小于5000元最后设定。元最后设定。变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*变量值分组合并变量值分组合并重庆交通大学管理

21、学院09 五月 2024*务必选上务必选上该项该项变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*变量值分组合并变量值分组合并重庆交通大学管理学院09 五月 2024*recode过程提供了精确分组的功能,但如果希望进行的分过程提供了精确分组的功能,但如果希望进行的分 组是有规律的,比如等距分组,或等样本量分组,使用组是有规律的,比如等距分组,或等样本量分组,使用 recode过程进行操作就显得非常麻烦,且可视化程度不高。过程进行操作就显得非常麻烦,且可视化程度不高。此时可以考虑使用此时可以考虑使用visual bander过程进行可视化分段。过程进行可视化分段。连续变量

22、的可视化分段连续变量的可视化分段重庆交通大学管理学院09 五月 2024*例例3 仍仍以以数数据据fee.sav为为例例,按按变变量量total将将病病人人分分为为5组组,5000元以下为第一组,元以下为第一组,5000元以上的按等间距的方式分元以上的按等间距的方式分4组。组。连续变量的可视化分段连续变量的可视化分段重庆交通大学管理学院09 五月 2024*连续变量的可视化分段连续变量的可视化分段重庆交通大学管理学院09 五月 2024*连续变量的可视化分段连续变量的可视化分段重庆交通大学管理学院09 五月 2024*设定分段规则设定分段规则连续变量的可视化分段连续变量的可视化分段重庆交通大学

23、管理学院09 五月 2024*连续变量的可视化分段连续变量的可视化分段自动填充自动填充值标签值标签重庆交通大学管理学院09 五月 2024*连续变量的可视化分段连续变量的可视化分段重庆交通大学管理学院09 五月 2024*例例4 仍以数据仍以数据fee.sav为例,查看变量为例,查看变量total中是否出现值中是否出现值6890。查看特定变量值查看特定变量值重庆交通大学管理学院09 五月 2024*查看特定变量值查看特定变量值重庆交通大学管理学院09 五月 2024*查看特定变量值查看特定变量值重庆交通大学管理学院09 五月 2024*查看特定变量值查看特定变量值重庆交通大学管理学院09 五月

24、 2024*查看特定变量值查看特定变量值重庆交通大学管理学院09 五月 2024*例例5 仍以数据仍以数据fee.sav为例,根据城市分组计算住院总费用的为例,根据城市分组计算住院总费用的 秩次。秩次。变量编秩变量编秩重庆交通大学管理学院09 五月 2024*变量编秩变量编秩重庆交通大学管理学院09 五月 2024*v 用于定义秩次类型,默认为用于定义秩次类型,默认为rankrank(秩分数)(秩分数)变量编秩变量编秩重庆交通大学管理学院09 五月 2024*v 用于定义对相同值观测量的处理方式用于定义对相同值观测量的处理方式 默认值为取平均秩次。默认值为取平均秩次。变量编秩变量编秩重庆交通大

25、学管理学院09 五月 2024*变量编秩变量编秩重庆交通大学管理学院09 五月 2024*将字符变量转换为数值变量将字符变量转换为数值变量例例6 仍以数据仍以数据fee.sav为例,将字符型变量为例,将字符型变量city转化成数值变量转化成数值变量newcity。重庆交通大学管理学院09 五月 2024*将字符变量转换为数值变量将字符变量转换为数值变量新变量名新变量名重庆交通大学管理学院09 五月 2024*将字符变量转换为数值变量将字符变量转换为数值变量重庆交通大学管理学院09 五月 2024*将字符变量转换为数值变量将字符变量转换为数值变量重庆交通大学管理学院09 五月 2024*重庆交通

26、大学管理学院09 五月 2024*重庆交通大学管理学院09 五月 2024*重庆交通大学管理学院09 五月 2024*重庆交通大学管理学院09 五月 2024*重庆交通大学管理学院09 五月 2024*个人道德素养个人道德素养重庆交通大学管理学院09 五月 2024*做好個人道德素養;不要因為貪小便宜,貪一時方便而不顧道德品行丟失把人格尊嚴都降低了。重庆交通大学管理学院09 五月 2024*因為一個人把道德品質丟失了,再想建立起來將是萬分的困難。重庆交通大学管理学院09 五月 2024*所以每個人都應該尊首道德底線,不應敗壞基本道德品質。重庆交通大学管理学院09 五月 2024*以下是公司裡面

27、出現的不好的現象:1、厕所紙巾偷到宿舍去用2、車間應急藥箱裡面的藥偷走(偷盜行為可恥)重庆交通大学管理学院09 五月 2024*以下是公司裡面出現的不好的現象:1、公共场所随意扔垃圾2、電視房垃圾亂丟重庆交通大学管理学院09 五月 2024*以下是公司裡面出現的不好的現象:恶意损坏公共财物重庆交通大学管理学院09 五月 2024*以下是公司裡面出現的不好的現象:吃饭不要浪废食物重庆交通大学管理学院09 五月 2024*道德與生活道德與生活從字義看兩者的意義與差別:1、倫理的意義倫理的意義:倫類別、關係;理紋理、道理。倫理人類社會裡種種身分間合理的關係,行為分際(做人要守本分做人要守本分)。(哪

28、些人際關係、身分)2、道德的意義道德的意義:道道路、道理;德獲得。道德走人走的道路,便可獲得人的待遇。(不走捷徑、不誤入歧途尊嚴、榮譽)人道人道 (ps.如何批評一個人罔顧為人?)重庆交通大学管理学院09 五月 2024*道德與生活道德與生活1、利己利己:理性認識到遵守規範有利於己。(奸商/信譽商人)2、利人利人:追求人性中的真、善、美。(崇高的可能性)。(愛人者人恆愛之,敬人者人恆敬之;德不孤必有鄰。)(典範在夙昔-林靖娟、鐵達尼號的樂師、德雷莎修女、史懷德.)3、利己利人利己利人:兼顧自我理想與社會進步。Bill Gates?不做”損人利己”之事。Ps.回想郭爾堡的道德認知理論、馬斯洛的需求層次理論。重庆交通大学管理学院09 五月 2024*-THE END-

展开阅读全文
部分上传会员的收益排行 01、路***(¥15400+),02、曲****(¥15300+),
03、wei****016(¥13200+),04、大***流(¥12600+),
05、Fis****915(¥4200+),06、h****i(¥4100+),
07、Q**(¥3400+),08、自******点(¥2400+),
09、h*****x(¥1400+),10、c****e(¥1100+),
11、be*****ha(¥800+),12、13********8(¥800+)。
相似文档                                   自信AI助手自信AI助手
搜索标签

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        获赠5币

©2010-2024 宁波自信网络信息技术有限公司  版权所有

客服电话:4008-655-100  投诉/维权电话:4009-655-100

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :gzh.png    weibo.png    LOFTER.png 

客服