资源描述
,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,#,法案规定:在相同的评估权限内,对铁路运,输财产的评估价格与其真实市场价值的比率,不能高于其他工商业财产评估价值与其真实,市场价值的比率。在该法案下,如果对铁路,征税的比率比其他财产的征税比率高,5%,或者,更多,那么铁路方面可获得免税权。,如果你是铁路方面,你希望多征收你的税吗?,财产评估价值由税率决定,真实市场价值以近期销售额的样本为基础决定。,在洛杉矶,铁路方面和州政府发生了诉讼,争议在于均值方面。,政府方面认为:对工商企业财产的市场价值计算,应该采用,加权均值,。,而铁路方面却认为:对工商企业财产的市场价值的计算,应该采用,加权中位数,。,最后,法院采取了铁路方面的算法,铁路胜诉,地方政府从而丧失了这一年铁路的税收。,年平均收入,官方统计说:东莞,2011,年的人均年收入是,22882,元;这个数据是平均值;,20,0000 10,0000 2,0000 1,0000 8000 6000 5000 4000 2000 1800 0,均值:,32436,;中位数,6000,什么是统计学,问题,1,:,statistics,的词根是什么?,State,;是指州或者说政府。统计学是政府需要做的工作。,统计学是被定义为一组由(,1,)收集数据(,2,)分析数据(,3,)由数据得出结论而组成的概念、原则和方法。,问题,2,:美国每年总统选举的结果预测是如何进行的?,统计学就是从样本反应的信息中推测总体状况的学问。,如何使收集的数据更加客观?,(,1,)调查方法,邮寄调查、网络调查、现场调查、留置调查、电话调查、,RDD,调查(,Random Digita Dailing,),(,2,)调查问卷和问题,我们先来看一份关于某茶餐厅的调查问卷,分析其,中的问题。,参与此次调查的顾客将获得我们赠送的优惠券,请在结账时索取!,性别:男 女,年龄:岁,职业:,年收入:万,Q.,您感觉店内的就餐环境如何?,非常不好 不好 一般 好 非常好,Q.,您感觉女服务员的制服和服务态度如何?,非常不好 不好 一般 好 非常好,Q.,您觉得我们的红茶如何?,非常不好 不好 一般 好 非常好,Q.,您觉得价格如何?,便宜 适中 贵,Q.,对于以下,4,种红茶,请按照自己的喜好程度进行排序。,1.,原味红茶 ()位,2.,柠檬茶 ()位,3.,奶茶 ()位,4.,玫瑰茶 ()位,Q.,您喜欢在茶餐厅就餐吗?,喜欢 不喜欢,应当避免的问题一:过于隐私的问题或者有威胁的问题,Q.,年收入 万,Q.,您的年收入是?(限选一项),A.20,万元以上;,B.10-20,万元;(包括,20,万元),C.5-10,万元;(包括,10,万元),D.1-5,万元;(包括,5,万元),E.1,万元及以下;,避免过于隐私的问题;,Q,:你慢跑吗?,Q,:你偶尔慢跑吗?,降低或者排除由社会期待所导致的偏误,几种询问“你是否杀死过你的妻子?”的方法,第一,,不经意法,:您是否恰巧谋杀过您的妻子?,第二,,人人法,:,“,您知道,现在很多人一直都想杀死他们的妻子,您是否恰巧杀死了自己的妻子?,”,第三,,他人法,:您是否认识某个曾经谋杀过他的妻子的人?您自己呢?,第四,,密封投票法,:要求回答者把答案封在信封里,并携带醒目的,“,密封投票箱,”,;,应当避免的问题二:表达不明确或者一个问题两层含义,Q.,您觉得价格如何?,Q.,您觉得红茶的价格如何?,Q.,您觉得女服务生的制服和服务态度如何?,Q1.,您觉得女服务生的制服如何?,Q2.,您觉得服务生的服务态度如何?,Q,:,“,在这个家庭中有多少个孩子?,”,这个问题会产生什么样的歧义?,第一,孩子的年龄是指多少?,未满,18,岁,那么大学生算不算一个家庭的孩,子?,第二,孩子是指这个家庭中丈夫和妻子的亲,生子女吗?,那么如果是重组家庭,前妻或者前夫的孩子,如何算?养子、养女算不算?其他亲戚在家,里寄宿的孩子算不算?,第三,孩子是指和父母住在一起的子女吗?,那么,没有住一起的成年的结婚的子女一般是不算的,但是,不住一起的未,结婚的孩子算不算?结了婚但是住一起,的孩子算不算?,语序的误解,有两位牧师,一位多明我会(天主教派别之一)会士和一位耶稣会会士,正在讨论同时吸烟和祈祷是否有罪。由于无法达成共识,于是他们分别去请教各自的上司。一星期后,他们再度相遇。多明我会会士说:,“,哎,你的上司怎么说?,”,耶稣会会士答道:,“,他说没问题。,”,“,那太可笑了,,”,多明我会会士应道,,“,我的上司说那是犯罪。,”,耶稣会会士说:,“,你怎么问他的?,”,多明我会会士说:,“,我问他,,在祈祷的时候抽烟行不行?,”,“,哦,,”,耶稣会会士说,,“,我问我的上司,,在抽烟的时候祈祷行不行,?,”,应该避免的问题三:排序问题,Q.,对于以下,4,种红茶,请按照自己的喜好程度进行排序。,1.,原味红茶 ()位,2.,柠檬茶 ()位,3.,奶茶 ()位,4.,玫瑰茶 ()位,Q.,请在下列红茶中,选出您所喜爱的种类(可选多项),原味红茶 柠檬茶 奶茶 玫瑰茶,Q.,请在下列红茶中,选出您最喜爱的种类(限选一项),原味红茶 柠檬茶 奶茶 玫瑰茶,应当避免的问题四:有倾向性的问题,例如,你想了解工人是否认为自己的工作得到了公正的报酬。,问题一:你是否觉得你的工作得到了公正的报偿?,问题二:你的雇主或者你的代理人是否用花招骗取你们的部分收入?,有倾向性的问题往往不能得到客观的答案。,剩余价值理论的来源,。,应当避免的问题五:不具体的问题,Q,:您认为政府是否应该在一个有限的时段内,给予那些失业的工人金钱,直到他们能够找到另外的工作为止?,Q,:您是否愿意缴纳更高的税,以给予那些没能找到满意工作的人最多,26,周,每周,25,美元的资助?,Q,:有一项提案建议在失业和找工作的一年当中,政府给予那些需要养家糊口的失业工人共,26,周每周,25,美元的资助。您是赞成还是反对这个计划呢?,63%34%46%,应当避免的问题六:太多开放型问题,Q.,您一般参见什么样的户外活动?,A.,爬山,B.,慢跑,C.,散步,D.,打球,Q.,您一般参见什么样的户外活动?,(),应当多采取封闭式问题,应当避免的问题七:没有中值的答案,Q.,如果租住单身公寓,您会比较看重哪些条件,不重视,不太重视,一般,有些重视,重视,距最近车站的距离,房间朝阳,1.,如果直接回答,“,是,”,或者,“,否,”,,会增加受访者的回答难点,2.,与含有,“,中值,”,的相比,不含中值的直方图的正态分布的相似度较低,不重视,不太重视,有些重视,重视,距最近车站的距离,房间朝阳,样本的选择:确信锅里的汤被搅拌均匀,当我们品尝一勺我们做的汤时,我们关心的不是这勺汤怎样,而是整个锅里的汤味道如何。如果锅里的汤被充分搅拌了,我们只需要品尝一勺就可以知道整锅汤的味道。,越战征兵的例子,:,在美国对越南的战争中,为使前线有足够的士兵,美国政府制定了一个,“,抓阄,”,的征兵计划。该计划打算把,1,到,366,的号码随机的分配给一年中的每一天,然后由军事部门按分配的号码顺序把生日与之相对应的年轻人分批征召入伍。这种方法的目的是为了给大家相等的机会卷入这场不受欢迎的战争中,因为被征召入伍的可能性是随机决定的。,在第一年的征兵计划中,号码,1,被分配给,9,月,14,日,分配的方法是随机抽取一个大容器中的,366,个写上了日子的乒乓球。所以第一批被征召入伍的士兵就是年满,18,岁且生于,9,月,14,日的合格青年。生日被分配为号码,2,的青年则在第二批入伍。以此类推。,当所有的日子被分配的第二天,对应的号码被公布出来。我们本应该预期:有差不多一半的较小的号码(,1,到,183,)被分配给前半年的生日,即,1,月份到,6,月份;另一半较小的号码被分配给后半年的日子,即,7,月份到,12,月份。虽然不可能恰好一半,但是应该接近一半。但是,结果却是:有,73,个较小的号码被分配给了前半年的日子,同时有,110,个较小的号码被分配给后半年的日子。,这是为什么呢?,结论:乒乓球应该被充分搅拌。,六合彩在选取号码前,被充分搅拌。,随机样本和方便样本的区别?,随机样本:,指总体的每一个个体有一个已经的(或者相同的)机会被包含在该样本中。,方便样本:,能够很容易很经济地得到的样本。,例如:一些杂志要求读者寄回杂志后面附带的问卷。,这些数据并不包括所有的人,甚至也不是该杂志的读者的总体的典型样本,而只是花了时间和精力寄回的读者而已。,抽样的方法有哪几种?,简单随机抽样法、分层抽样法、二阶抽样法、分层二阶抽样法。,例如:从全国人口中抽出,1800,个人,(,1,)简单随机抽样,从全国的姓名名单上随机抽取,1800,个;,这种方法的难题有:由于总体太大,,全国的名单很难得到,;如果运气不好,可能有点全体没有代表,例如偏远的省市,或者人数较少的民族等;,(,2,)分层抽样法,先将总体按照,“,出生地,”,、,“,出生年代,”,、,“,职业,”,或者,“,最高学历,”,等属性划分出不同的层;,然后再针对每层依据构成比例做简单随机抽样;,从不同的层得到的调查结果会有较大的区别:例如,“,喜欢哪类食品,”,会因,“,地域,”,不同而有所不同;而,“,喜欢哪位明星,”,会因,“,出生年代,”,不同而有所不同;,如果能够事先预料到这些情况,适合使用这种方法。,不过这种方法也需要,全国的名单,,还必须知道,分层时所依据的信息,。,例如:,按照地区对全国人口进行抽样,我们必须知道全国人口总数,以及各地区人口数,以求出各地区占总人口的比率,从而根据这一比率分配抽样数;,另外,对每一地区进行简单随机抽样,还必须知道每一地区的具体名单,也就是必须知道全国总的人口的具体名单了。,(,3,)二阶抽样法,也就是分,2,个阶段抽取数据。,例如,我们第,1,阶段按照地区进行随机抽样,第,2,阶段从抽出的地区中进行简单的随机抽样。,在对地区进行随机抽样时,我们必须首先知道每一地区的确切人数以及总的人口数,在,1,到总人口数中随机抽取,10,个数字,与这,10,个数字相对应的累积人口数的地区,就是我们要选择的,10,个地区。,然后,再从这,10,个地区中每一个地区随机抽样,180,个人。,这种方法的优点是:只要知道,所选地区的具体名单即可,,但是还必须知道每个地区的确切人口数和总人口数。,(,4,)分层二阶抽样法,也就是分层抽样法和二阶抽样法相结合的方法。,首先,按照地区对总样本进行分层,每层按照层的人数与总人数的比进行样本数分配;,然后,对于每个地区,随机抽取,10,个(或者更少的)地区,进行简单随机抽样。,这样,就只需要知道每个地区占总人口的比率,以及抽中的几十个小地区的具体名单即可,而不需要知道全国的具体名单,但是全国每个民族都会有代表。,具体例子见,“,全国人口分布,”,抽样调查的样本数是多少?,(,1,)当总体,N,为有限总体,样本抽样的大小公式是:,其中,是显著水平,,P,是,0.5,(因为设定为,0.5,时可以得出最可信的样本大小),,Z,是显著水平为,时的正态分布的分位数,当,=0.05,时,,Z=1.96,;当,=0.01,时,,Z=2.58,。,(,2,)当抽样总体相当大或者无限大,样本抽样的大小公式为:,有些学者直接从问卷调查的属性来界定样本抽样人数,如,Creswell(2002),认为一般的问卷调查样本数最好在,350,人以上,而,Airasian,和,Gay,认为样本数最好占总体的,10%,以上,如果总体少于,500,,则最好占,20%,以上,总体特别少的时候,要占,30%,以上。,总之,学者间对样本数也没有一致的看法,如果一般的总体,就按照上述公式计算即可。,如何设计一个实验?,对比实验:,让研究对象组成一些模拟陪审团,去裁断一起刑事案件。所有的陪审团都被告知按照排除合理怀疑的证明标准去裁断被告人是否有罪,但是其中一些也同时被告知在裁断之前他们应当给出被告人有罪的概率。,结果,后面这些陪审团做出有罪裁决的可能性要,小些,。,实验的最早的例子发生在,17,世纪初,当时英国海军试图发现坏血病的起因。该病症状为牙龈肿大出血,皮肤上有青灰斑点;在海上长期航行的水手经常患有此病。英国海军部怀疑是因为缺乏柑橘类水果而导致此病。当这个想法被提出时,四艘海军军舰正要离开英国做长期航行。为调查是否因缺乏柑橘类水果而导致了坏血病,海军部安排其中一艘船上的水手每天喝柑橘汁,而其它三艘船上的水手则没有柑橘汁供应。,航行还未结束,在其它三艘船上就有很多水手染上了坏血病,以至于不得不把每天喝柑橘汁的水手们分配到这些船上帮助他们进港。尽管实际操作的实验计划有可能从各个方面得到改进,但是该实验显然成功地证实了最初的想法。,实验组:喝柑橘汁的水手;,对照组:不喝柑橘汁的水手;,这种实验方法产生的问题:,第一,组织问题,:被实验者的配合程度,。,有点实验由于时间过长,而造成参与人员的退出等情况。,第二,心理学问题,。我们的研究本身可能会给被研究者带来一些变化,而不按照平时的行为方式进行行为,从而使得我们的观察结果出现偏差。例如上面我们讲到的被调查者回答问题时,并非自己的真实想法,而是社会的期许回答一样。,例如:,1924,年,1933,年间,对通用电气公司的工人生产率的系列调查。在一次调查中,一组社会学家和公司人事部门的成员研究了各种照明程度对生产灯泡的工人生产率的影响。研究者们增大照明度,发现产量增加。但是,奇怪的是,当他们减少照明度的时候,发现产量也增加了。,第三,道德问题。实验组和对照组,什么人进实验组?什么人进对照组?有时候会产生道德问题。例如:对小儿麻痹症疫苗的效果的实验中,将一些小儿患者为了实验,而不进行疫苗接种,这种做法对于这些小孩来说是残酷的。,我们来设计一个实验,看看如何避免上述问题:,例如:班级规模影响学生表现吗?,我们一般的经验是:小班比大班更有利于学习,那么,我们如何进行实验?,首先,命题具体化:,小班是指,13-17,个学生的班级,普通班是指,22-25,个学生的班级;,学习效果通过标准化教育考试来衡量;,其次,将实验对象具体化:,5,岁的孩子,经过,4,年的小班学习后,小班的标准化考试成绩要比普通班好,问题:如果你的孩子被分配在普通班而,不是小班,你会怎样想?,再次,确定抽样方法和抽样数。,样本数:,=384.16,可是这个实验由于费用的原因,并且,研究者主要只考虑美国田纳西州的情况,所以,是以田纳西州为总体,最终确定实验组和对照组分布为,76,,在,76,所不同的小学进行实验。,学校和学生如何保证其随机性,?,第一,每所学校分配一个小班,一个普通班,而不能够一个学校分配几个小班,另一个学校分配几个普通班;这样是为了控制其他变量对结果的影响;,第二,孩子必须被随机的分配到不同类型的班级中,以消除孩子家庭情况、智力水平等对结果的影响。,最后,在实验中,老师也是被随机的分配的。,结果是:仅仅,1,年后,小班学生的阅读能力领先,1.5,个月,数学能力领先了,2.5,个月,四年之后,优势仍然存在。,数据的种类和输入,Q1.,读完这本杂志你的感觉是什么?,1.,非常有趣,2.,有点有趣,3.,一般,4.,有点无趣,5.,非常无趣,Q2.,你的性别是?,1.,男,2.,女,Q3.,你的年龄是?,岁?,Q4.,平均每月购买几本杂志?,本?,问题:,英语四六级考试?气温?出生地?出生年月 体重?,法律渊源 法律效力级别 法律的部门,
展开阅读全文