收藏 分销(赏)

山西通信市场抽样调查样本量配置方法.docx

上传人:pc****0 文档编号:8910887 上传时间:2025-03-07 格式:DOCX 页数:7 大小:27.20KB 下载积分:10 金币
下载 相关 举报
山西通信市场抽样调查样本量配置方法.docx_第1页
第1页 / 共7页
山西通信市场抽样调查样本量配置方法.docx_第2页
第2页 / 共7页


点击查看更多>>
资源描述
山西通信市场抽样调查样本量配置方法    作者:***    关键词:  市场调查  样本量  配置方案    摘要:     本文从市场调查的实践出发,结合通信市场用户的消费特征和实施调研的数据统计过程,系统地整理并提出了样本量配置的分布表,并在两项有关电信市场的调研中进行了实践,取得了满意的效果。本文的主要结论对现实的市场研究具有较高的参考价值和简易的可操作性,同时可以很好地保证样本的精确程度,减小抽样误差。     无论是全面调查还是抽样调查,样本产生的误差都是不可避免的。因此,为了获得较高精度和较高可靠性的数据,与误差作斗争就成为市场调研最大的课题之一。依照传统的理论习惯,人们在研究实践中通常采用调整样本量和改进抽样技术的方法来减小误差和提高调研的精确度。但问题是,虽然我们可以用较大的样本来弥补抽样技术的误差,用足够多的样本数来保证市场数据的真实可靠,但委托方对样本量增多而带来的调研成本的提高也非常敏感,调研的经济约束要求我们用最少的样本数来达到最大的抽样精确度。     一、 影响样本量的主要因素     在市场调研实践中,样本量是关系到调研精确度和市场研究公司效益的一项重要指标。确定样本量是抽样方案的一个重要内容,也是实施抽样前必须解决的一个问题。样本量过大,会使调查费用显著增加,人力及管理费用加大,从而也难以体现抽样调查的优越性;样本量过小,又会使样本对总体的代表性降低,增大抽样误差。因此,解决抽样设计中的样本量问题至关重要。从统计学的角度来看,影响样本量的因素主要包括置信度和允许误差。简言之,置信度是对抽样估计可靠性的度量,允许误差是指事先要求与一定的置信概率相对应的抽样误差 的最大范围,它是对抽样估计的精确度提出的要求。 另一方面,就具体的调研项目而言,项目的总预算费用又构成了样本量的一个上限。容量过大就会突破预算约束,导致超支,这是受托方风险。设经费总额为c,费用函数可以表示为   其中, 为固定费用,与样本量无关; 为平均每一样本单位需要的调查经费。由此解出的样本量 ,可以作为经费约束的一个基本条件。     二、 简单随机抽样样本量的测度方法     1. 基本公式 在简单随机抽样的条件下,我们所使用的确定调查样本量的公式为:                        其中:n代表所需要样本量;Z表示置信水平下的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68;S代表总体的标准差;d代表置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为:                          其中:n表示样本量;z表示置信水平下的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68;p表示目标总体的比例期望值;d表示置信区间的半宽,即调查误差。 2.公式的应用 一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑α=95%的置信水平,那么Z=1.96;或者取α=99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量。比如,要了解某城市的居民收入,假定我们知道该市居民收入的标准差为1000,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为                       即需要调查的样本量为385个。 3.最大样本量的讨论 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是比较困难的。总体的标准差是123, 还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。 如果我们采用相对误差表述的精度,我们有                      其中P表示相对误差 根据上述公式,我们可以计算在相对误差一定的情况下,所需的最大样本量。以下是在置信程度95%的水平下,在不同相对误差下的最高样本量: 相对误差 1% 2% 3% 4% 5% 10% 20% 样本量 38416 9604 4268 2401 1537 385 104 通常,变异系数为1的情况是很少见的,根据本人对市场研究中经常遇到的情况,变异系数多在50%以下,因此,实际所需要的样本量可以进一步缩小。 对于比例型变量,在事先缺乏对比例的估计时,我们可以采用最保守的估计法,即p=0.5,以下是比例p在不同绝对误差程度下,所需的最大样本量(95%置信水平): p的绝对误差 0.01 0.02 0.03 0.04 0.05 0.10 所需最大样本量 9604 2401 1067 601 385 96 4. 实际调查样本量的确定原则 虽然我们根据公式可以从理论上确定样本量的上限,但是由于实际工作的经费和时间限制,使用最大样本量的可能性很小。而且,实际研究的情况通常要复杂得多,一项研究往往要考虑多个目标,即要求对多个指标的误差进行控制,而不是简单地考虑一个指标。因此我们在实际的市场研究中,必须综合考虑,采用多种方式来确定样本量。 (1)调查的主要目标 一个现实的市场调查往往有多个目标,对于一些目标单一的调查,调查的样本量往往可以很少,比如100个,甚至50个就足够了。而对于具有多个目标的研究,必须考虑这些目标中变异程度最大,要求精度最高的目标。 (2)分类比较的程度 分类是市场研究中一个最基本的方法,研究者往往是通过分类来发现细分市场,确定产品的市场定位等。假定对同一变量(研究目标),在一定精度与置信程度下,只要100个样本量就足够了,如果我们仅仅希望了解不同性别的消费者市场,则确定样本量时只需要考虑两类消费者的样本量,这样调查的总样本量可能需要200个以上,如果希望了解不同年龄层的消费者,则可能要将消费者分为多类,如分为:20岁以下,20-35,35-50,50岁以上等四类,这样的样本量需要400个以上。也就是说,确定样本量时必须考虑到每一类别的样本量。 (3)调查区域的大小 根据常识,调查区域越大,所需要的样本量可能越大,因为大区域内的样本变异程度通常较难掌握。此外,在实际研究中,我们还往往需要对大区域进行进一步分类,以寻求更加准确的市场细分。比如,对柯达胶卷进行的调研在北京的取样明显应高于太原。 三、山西联通市场调研的抽样设计分配表 山西联通是中国联合通信集团公司的全资子公司,负责经营山西省各地市的综合电信业务。该公司十分注重市场调查,对市场调研的精度和深度都有一定的要求。2003年6月实施的山西省联通用户综合业务调研中,样本的设计具有一定的科学性。本文给出了本次调查计划中全省范围市场调查的样本配置方案,以资参阅。 设p为本次调查总体的任一比例值, 为其估计值,要求            则样本大小n可以计算如下: 误差d 置信度1-α 样本大小n 误差d 置信度1-α 样本大小n 0.07 0.90 138 0.03 0.95 0.96 0.97 0.98 0.99 1067 1172 1308 1509 1842 0.06 0.90 188 0.05 0.95 0.96 0.97 0.98 0.99 385 422 471 543 663 0.02 0.95 0.96 0.97 0.98 0.99 2401 2637 2946 3393 4145  0.04 0.95 0.96 0.97 0.98 0.99 601 660 736 849 1036 0.01 0.95 0.96 0.97 0.98 0.99 9604 10548 11773 13573 16577 假设在95%的概率保证下,最大误差不超过2%,可取的一个样本方案是2401。我们考虑到山西省各地市人口数量的差异,采用比例配置法把全部样本依照比例分摊到各个地市。结果如下表:  地区 人口(万人) 人口比例 样本数n 修正样本数m 太原市 2930000 0.09491416 227 227 大同市 2690000 0.08713962 209 209 阳泉市 1220000 0.03952057 94 138 长治市 3060000 0.09912536 238 238 晋城市 2060000 0.06673145 160 160 朔州市 1320000 0.04275996 102 138 忻州市 2820000 0.09135083 219 219 离石市 3280000 0.10625202 255 255 晋中市 2960000 0.09588597 230 230 临汾市 3840000 0.12439261 298 298 运城市 4690000 0.15192744 364 364   30870000 1 2401 2476 我们注意到,阳泉市和朔州市的样本均在138以下,也就是说,这两个地市的抽样精度还达不到90%的置信度,而最大误差则超过了7%。因此,我们对这两个地市的样本数量进行修正,均提高到138,以满足各个地市调查数据可以独立的要求,此时,两个地市的抽样概率置信度都达到了90%,最大误差控制在7%以下。调整以后的样本列在表的最右边一列。这时,样本总数达到了2476个。    注 记:     1.通过对方差的估计,采用公式计算所需样本量,主要采用两步抽样,即在调查前先抽取少量的样本,得到标准差S的估计,然后代入公式中,得到下一步抽样所需样本量n;如果有以前类似调查的数据,可以使用以前调查的方差作为总体方差的估计。 2. 根据经验,确定样本量的主要方法有: 如果以前有人做过类似的研究,初学者可以参照前人的样本。 如果是大型城市、省市一级的地区性研究,样本数在500-1000之间可能比较适合;而对于中小城市,样本量在200-300之间可能比较适合;如果是多省市或者全国性的研究,则样本量可能在1000-3000之间比较适合。 3.作为一个常识(主要是为了显著性检验),要进行分组研究的每组样本量应该不少于30个。 4.通过调研设计所作的研究,可以采用较小的样本量。如产品试用(留置)调查,在经费有限的情况下,可以将每组的样本量降低至15个左右,最好每组在30以上。此外,我们在多次的实际研究中发现,每组样本超过50个可能是一种资源浪费
展开阅读全文

开通  VIP会员、SVIP会员  优惠大
下载10份以上建议开通VIP会员
下载20份以上建议开通SVIP会员


开通VIP      成为共赢上传

当前位置:首页 > 包罗万象 > 大杂烩

移动网页_全站_页脚广告1

关于我们      便捷服务       自信AI       AI导航        抽奖活动

©2010-2025 宁波自信网络信息技术有限公司  版权所有

客服电话:4009-655-100  投诉/维权电话:18658249818

gongan.png浙公网安备33021202000488号   

icp.png浙ICP备2021020529号-1  |  浙B2-20240490  

关注我们 :微信公众号    抖音    微博    LOFTER 

客服