资源描述
Click to edit Master title style,Click to edit Master text styles,Second level,Third level,Fourth level,Fifth level,#,谁说菜鸟不会数据分析,谁说菜鸟不会数据分析,三心二意,数据处理,03,无米难为巧妇,数据准备,02,数据分析那些事,01,第,1,章 数据分析哪些事儿,数据分析是“神马”,数据分析六部曲,常用指标或术语,数据分析是“神马”,数据分析是指适当的,统计分析,方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化。以求最大化地开发数据的功能,发挥数据的作用。,数据分析的目的,数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结研究对象的内在规律。,菜鸟与数据分析师的区别,菜鸟会想,分析师会想,这张曲线图真好看,怎么做的?,数据变化的背后真相是什么?,这些数据可以做什么样的分析?,从哪些角度分析数据才系统?,高级分析的方法在这儿能用吗?,用什么分析方法最有效?,要做多少张图表?,图表是否表达出有效的观点?,除了为数据添加文字说明还需说什么?,数据分析的目的达到了吗?,数据分析报告要写多少页?,数据分析报告有说服力吗?,数据分析师的基本素质,态度严谨负责,好奇心强烈,逻辑思维清晰,擅长模仿,勇于创新,数据分析六步曲,明确目的,先决条件,提供方向,数据收集,数据库,其他媒介,数据处理,清洗、转化、提取、计算,数据分析,统计分析,数据挖掘,数据展现,图表表格文字,报告撰写,框架清晰,明确结论,提出建议,一般数据分析用,Excel,可以完成,若高级数据分析,则需要使用数据分析工具,如,SPSS,Statistics,等。,常用指标或术语,平均数,绝对数与相对数,百分比与百分点,频数与频率,比例与比率,倍数与番数,同比与环比,平均数,绝对数与相对数,绝对数:,是反映客观现象总体在一定时间、地点条件下的总规模、总水平的,综合指标,。也是数据分析中常用的指标,如:,GDP,、总人口数等。,相对数:是指,两个有联系的指标对比计算而得到的数值,用于反映客观现象之间数量联系程度的综合指标。计算相对数的基本公式:,比较数值(比数)相对数,=,基础数值(基数),分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。相对数一般以倍数、成数、百分数等表示,它反映了客观现象之间数量联系的程度。,使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用,下面我举几个例子,你一看就明白了。,百分比与百分点,百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。,百分点是指不同时期以百分数的形式表示的相对指标的,变动幅度,,,1,个百分点,=1%,。例如,图,1-10,中某公司发言人就混淆了百分比与百分点的概念。,表示构成的变动幅度不宜用百分数,而应该用百分点。因此,这位公司发言人正确的说法应该是“公司今年的利润是,45%,,比去年的,28%,提高了,17,个,百分点,”。,频数与频率,频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频繁程度,一般采用百分数表示,所有组的频率加总等于,100%,。还是用某校,A,班的例子,,30,个男同学在,50,个同学中出现的频率为,60%,,即(,3050,),X100%,;而,20,个女同学在,50,个同学中出现的频率为,40%,,即(,2050,),X100%,,如图,1-11,的右图所示。,比例与比率,比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。比如,,A,班共有学生,50,人,男生,30,人,女生,20,人,则男生的比例是,30/50,,女生的比例是,20/50,。由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。,比率是指不同类别数值的对比,它反映的,不是部分与整体之间,的关系,而是一个整体中各部分之间的关系。比如刚才的例子,男生,30,人,女生,20,人,则男生与女生的比率是,30/20,,如图,1-12,所示。这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每,100,名女性数量相对的男性数量来表示的。,倍数与番数,倍数与番数同样属于相对数,但使用时容易混淆。倍数是一个数除以另一个数所得的商。比如,AB,C,,就是说,A,是,B,的,C,倍。需要注意的是,倍数一般是表示数量的增长或上升幅度,而,不适用于表示数量的减少或下降,。,番数是指原来数量的,2,的,N,次方倍。比如翻一番为原来数量的,2,倍(,21,),翻两番为,4,倍(,22,)。如图,1-13,所示,,正确的说法:公司产品销量翻一番(,6.4=3.2X21,),从去年的,3.2,万件提高到今年的,6.4,万件。此外,我们成本控制也很好,由,20,万元下降了,50%,,今年成本为,10,万元,同比与环比,同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。例如,2010,年,12,月与,2009,年,12,月相比,如图,1-14,左图所示。,环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。例如,2010,年,12,月与,2010,年,11,月相比,如图,1-14,右图所示。,第一章总结,1,、,何谓数据分析,菜鸟与数据分析师的区别,以及数据分析师的基本素质。,2,、数据分析的六部曲,首先是明确分析目的和内容,然后是数据采集,第三步是将采集回来的数据进行处理,第四步是根据研究目标和内容进行分析,第五步是将分析出的结果通过图表的方式展现出来,最后一步是撰写数据分析报告。,3,、数据分析中经常用到的指标或术语,除掌握最基本的平均数、百分比等概念以外,还需要将容易混淆的指标进行明确区分,避免在以后阐述分析结果时出现错误。,第,2,章,无米难为巧妇,数据准备,初识,excel,数据来源,初识,excel,1,、自动调整列宽,1,)在菜单里选择“开始”主选项卡,格式,“,自动调整列宽”。,2,)选中要调整的几列,鼠标移至这几列任意列标之间,直到光标变成左右带箭头的十字图形,然后双击,选中的所有列即自动调整为最合适的列宽。,2,、如何录制宏,01,打开“视图”选项卡,单击“宏”的下拉菜单,先选中“使用相对引用”选项,再单击“录制宏”选项。,01,01,此时,会弹出一个“录制新宏的”对话框,在里面可以命名宏名,你可以根据宏实现的功能来命名,例如在这里我将其命名为“红色加粗”,然后,设置“快捷键”,注意不要与,excel,本身内置的快捷键重复。,02,01,在工作表执行你的操作,比如在这里,我们选择将,A1,单元格的数据变为红色并加粗。,03,01,再单击“视图”选项卡,“宏”“停止录制”。,04,01,选择任意其他单元格或者区域,再单击“视图”“宏”“查看宏”,并单击“执行”按钮,也可以使用组合按钮,ctrl+q,04,数据来源,1,、导入文本数据,01,单击“数据”选项卡,选择“来自文本”选项。,Excel,会弹出相对应的对话框。,01,第,3,章,三心二意,数据处理,1,、清洗数据小妙招,清洗数据小妙招,1,、冻结窗口,单击单元格,B3,,再选择“视图”主选项卡,冻结窗格,冻结拆分窗格,重复数据处理,思考:有几种找出重复值的方法?,1,、用条件格式标识重复数据,01,选择“开始”“条件格式”“突出显示单元格规格”“重复值”,01,2,、用计数函数来识别重复数据,01,选中,B2,单元格,然后输入函数公式:,=COUNTIF(A:A,A2),01,01,选中,C2,单元格,然后输入函数公式:,=COUNTIF(A$2:A2,A2),02,01,将公式复制到,B3,:,C11,的所有单元格。,03,重复数据处理,思考:有几种删除重复值?,1,、先介绍最简单的方式,直接利用菜单,里“删除重复项”选项,2,、用菜单操作来筛选重复数据,01,选择包含数值数据的单元格区域。,01,01,在“数据”选项卡上“排序和筛选”组中,单击“高级”按钮,弹出“高级选项”对话框。,02,01,选择“将筛选结果复制到其他位置”选项,在“复制到”文本框输入,B1,区域,在勾选“选择不重复的记录”复选框,单击“确定”按钮。,03,思考:有几种数据表的行列互换?,01,复制好区域后,在“开始”选项卡上的“剪贴板”组中,单击“粘贴”按钮,然后单击“选择性粘贴”,01,01,复制好区域后,使用键盘快捷键方式,按,”ctrl+alt+v”,,在勾上“转置”即可实现转置粘贴。,02,我的快捷键,ctrl+alt+v,01,复制好区域后,可以将数据粘贴在其他区域,在这时右下角会出现“粘贴”的下拉菜单,单击下拉菜单可以实现转置。,03,谁说菜鸟不会,数据分析,到此结束 谢谢,
展开阅读全文