资源描述
高中数学统计与概率知识点(文)
一、 众数: 一组数据中出现次数最多得那个数据。ﻫ 众数与平均数得区别: 众数表示一组数据中出现次数最多得那个数据;平均数就是一组数据中表示平均每份得数量。
二、。中位数: 一组数据按大小顺序排列,位于最中间得一个数据(当有偶数个数据时,为最中间两个数据得平均数)
三 。众数、中位数及平均数得求法。
①众数由所给数据可直接求出;②求中位数时,首先要先排序(从小到大或从大到小),然后根据数据得个数,当数据为奇数个时,最中间得一个数就就是中位数;当数据为偶数个时,最中间两个数得平均数就就是中位数。③求平均数时,就用各数据得总与除以数据得个数,得数就就是这组数据得平均数。
四、中位数与众数得特点。
⑴中位数就是一组数据中唯一得,可能就是这组数据中得数据,也可能不就是这组数据中得数据;ﻫ ⑵求中位数时,先将数据有小到大顺序排列,若这组数据就是奇数个,则中间得数据就是中位数;若这组数据就是偶数个时,则中间得两个数据得平均数就是中位数;
⑶中位数得单位与数据得单位相同;
⑷众数考察得就是一组数据中出现得频数;
⑸众数得大小只与这组数得个别数据有关,它一定就是一组数据中得某个数据,其单位与数据得单位相同;ﻫ (6)众数可能就是一个或多个甚至没有;ﻫ (7)平均数、众数与中位数都就是描述一组数据集中趋势得量、ﻫ五。平均数、中位数与众数得异同:ﻫ ⑴平均数、众数与中位数都就是描述一组数据集中趋势得量;ﻫ ⑵平均数、众数与中位数都有单位;ﻫ ⑶平均数反映一组数据得平均水平,与这组数据中得每个数都有关系,所以最为重要,应用最广;
⑷中位数不受个别偏大或偏小数据得影响;
⑸众数与各组数据出现得频数有关,不受个别数据得影响,有时就是我们最为关心得数据。
六、对于样本数据x1,x2,…,xn,设想通过各数据到其平均数得平均距离来反映样本数据得分散程度,那么这个平均距离如何计算?
思考4:反映样本数据得分散程度得大小,最常用得统计量就是标准差,一般用s表示。假设样本数据x1,x2,…,xn得平均数为,则标准差得计算公式就是:
七、简单随即抽样得含义
一般地,设一个总体有N个个体, 从中逐个不放回地抽取n个个体作为样本(n≤N), 如果每次抽取时总体内得各个个体被抽到得机会都相等, 则这种抽样方法叫做简单随机抽 样、
八、根据您得理解,简单随机抽样有哪些主要特点?
(1)总体得个体数有限;
(2)样本得抽取就是逐个进行得,每次只抽取一个个体;
(3)抽取得样本不放回,样本中无重复个体;
(4)每个个体被抽到得机会都相等,抽样具有公平性、
九、抽签法得操作步骤?
第一步,将总体中得所有个体编号,并把号码写在形状、大小相同得号签上、
第二步,将号签放在一个容器中,并搅拌均匀
第三步,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n得样本、
十一、抽签法有哪些优点与缺点?
优点:简单易行,当总体个数不多得时候搅拌均匀很容易,个体有均等得机会被抽中,从而能保证样本得代表性、
缺点:当总体个数较多时很难搅拌均匀,产生得样本代表性差得可能性很大、
十一、 利用随机数表法从含有N个个体得总体中抽取一个容量为n得样本,其抽样步骤如何?
第一步,将总体中得所有个体编号、
第二步,在随机数表中任选一个数作为起始数、
第三步,从选定得数开始依次向右(向左、向上、向下)读,将编号范围内得数取出,编号范围外得数去掉,直到取满n个号码为止,就得到一个容量为n得样本、
简单随机抽样一般采用两种方法:抽签法与随机数表法。
思考: 如果从100个个体中抽取一个容量为10得样本,您认为对这100个个体进行怎样编号为宜?
解法1:(抽签法)将100件轴编号为1,2,…,100,并做好大小、形状相同得号签,分别写上这100个数,将这些号签放在一起,进行均匀搅拌,接着连续抽取10个号签,然后测量这个10个号签对应得轴得直径。
解法2:(随机数表法)将100件轴编号为00,01,…99,在随机数表中选定一个起始位置,如取第21行第1个数开始,选取10个为68,34,30,13,70,55,74,77,40,44,这10件即为所要抽取得样本。
小结、
简单随机抽样就是一种最简单、最基本得抽样方法,简单随机抽样有两种选取个体得方法:放回与不放回,我们在抽样调查中用得就是不放回抽样,常用得简单随机抽样方法有抽签法与随机数法。
抽签法得优点就是简单易行,缺点就是当总体得容量非常大时,费时、费力,又不方便, 如果标号得签搅拌得不均匀,会导致抽样不公平,随机数表法得优点与抽签法相同,缺点上当总体容量较大时,仍然不就是很方便,但就是比抽签法公平,因此这两种方法只适合总体容量较少得抽样类型。
简单随机抽样每个个体入样得可能性都相等,均为n/N,但就是这里一定要将每个个体入样得可能性、第n次每个个体入样得可能性、特定得个体在第n次被抽到得可能性这三种情况区分开来,避免在解题中出现错误、
解题应用
如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作?
第一步,将这600件产品编号为1,2,3,…,600。
第二步,将总体平均分成60部分,每一部分含10个个体、
第三步,在第1部分中用简单随机抽样抽取一个号码(如8号)。
第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为60得样本。(如8,18,28,…,598)
十二、系统抽样得定义:
一般地,要从容量为N得总体中抽取容量为n得样本,可将总体分成均衡得若干部分,然后按照预先制定得规则,从每一部分抽取一个个体,得到所需要得样本,这种抽样得方法叫做系统抽样、
由系统抽样得定义可知系统抽样有以下特征:
(1)当总体容量N较大时,采用系统抽样、
(2)将总体分成均衡得若干部分指得就是将总体分段,分段得间隔要求相等,因此系统抽样又称等距抽样,这时间隔一般为k=[ ]。
(3)预先制定得规则指得就是:在第1段内采用简单随机抽样确定一个起始编号,在此编号得基础上加上分段间隔得整倍数即为抽样编号、
思考。下列抽样中不就是系统抽样得就是 ( C )
A、从标有1~15号得15号得15个小球中任选3个作为样本,按从小号到大号排序,随机确定起点i,以后为i+5, i+10(超过15则从1再数起)号入样
B工厂生产得产品,用传关带将产品送入包装车间前,检验人员从传送带上每隔五分钟抽一件产品检验
C、搞某一市场调查,规定在商场门口随机抽一个人进行询问,直到调查到事先规定得 调查人数为止
D、电影院调查观众得某一指标,通知每排(每排人数相等)座位号为14得观众留下来座谈
十三、系统抽样得一般步骤
用系统抽样从总体中抽取样本时,首先要做得工作就是什么?将总体中得所有个体编号、
如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,应先从总体中随机剔除5个个体,再均衡分成60部分、
一般地,用系统抽样从含有N个个体得总体中抽取一个容量为n得样本,其操作步骤如何?
第一步,将总体得N个个体编号。
第二步,确定分段间隔k,对编号进行分段、
第三步,在第1段用简单随机抽样确定起始个体编号l。
第四步,按照一定得规则抽取样本。
十四:分层抽样得定义:
若总体由差异明显得几部分组成,抽样时,先将总体分成互不交叉得层,然后按照一定得比例,从各层独立地抽取一定数量得个体,再将各层取出得个体合在一起作为样本、
分层抽样又称类型抽样
十五、 应用分层抽样应遵循以下要求及具体步骤:
(1)分层:将相似得个体归入一类,即为一层,分层要求每层得各个个体互不交叉,即遵循不重复、不遗漏得原则。
(2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量得比与这层个体数量与总体容量得比相等。
一般地,分层抽样得操作步骤如何?
第一步,计算样本容量与总体得个体数之比、
第二步,将总体分成互不交叉得层,按比例确定各层要抽取得个体数。
第三步,用简单随机抽样或系统抽样在各层中抽取相应数量得个体、
第四步,将各层抽取得个体合在一起,就得到所取样本、
十六、简单随机抽样、系统抽样与分层抽样三种抽样得类比学习
简单随机抽样、系统抽样与分层抽样既有其共性,又有其个性,根据下表,您能对三种抽样方法作一个比较吗?
对样本数据进行分组,组距得确定没有固定得标准,组数太多或太少,都会影响我们了解数据得分布情况、数据分组得组数与样本容量有关,一般样本容量越大,所分组数越多、
十七 列频率直分布表得步骤
列出一组样本数据得频率分布表可以分哪几个步骤进行?
第一步,求极差。
第二步,决定组距与组数。
第三步,确定分点,将数据分组、
第四步,列频率分布表、
十八、绘制频率分布直方图得步骤
频率分布直方图中
样本数据得频率分布直方图就是根据频率分布表画出来得,一般地,频率分布
直方图得作图步骤如何?
第一步,画平面直角坐标系、
第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度、
第三步,以组距为宽,各组得频率与组距得商为高,分别画出各组对应得小长方形。
小结
1、频率分布就是指一个样本数据在各个小范围内所占比例得大小,总体分布就是指总体取值得 频率分布规律、我们通常用样本得频率分布表或频率分布直方图去估计总体得分布、
2、频率分布表与频率分布直方图,就是对相同数据得两种不同表达方式、用紧凑得表格改变数据得排列方式与构成形式,可展示数据得分布情况。通过作图既可以从数据中提取信息,又可以利用图形传递信息。
3、样本数据得频率分布表与频率分布直方图,就是通过各小组数据在样本容量中所占比例大小来表示数据得分布规律,它可以让我们更清楚得瞧到整个样本数据得频率分布情况,并由此估计总体得分布情况、
十九、如何根据样本频率分布直方图,分别估计总体得众数、中位数与平均数?
(1)众数:最高矩形下端中点得横坐标、
(2)中位数:直方图面积平分线与横轴交点得横坐标、
(3)平均数:每个小矩形得面积与小矩形底边中点得横坐标得乘积之与、
二十:什么就是茎叶图
茎叶图又称“枝叶图”,它得思路就是将数组中得数按位数进行比较,将数得大小基本不变或变化不大得位作为一个主干(茎),将变化大得位得数作为分枝(叶),列在主干得后面,这样就可以清楚地瞧到每个主干后面得几个数,每个数具体就是多少。
第二部分:概率
一、随机事件得概率及概率得意义
1、基本概念:
(1)必然事件:在条件S下,一定会发生得事件,叫相对于条件S得必然事件;
(2)不可能事件:在条件S下,一定不会发生得事件,叫相对于条件S得不可能事件;
(3)确定事件:必然事件与不可能事件统称为相对于条件S得确定事件;
(4)随机事件:在条件S下可能发生也可能不发生得事件,叫相对于条件S得随机事件;
(5)频数与频率:在相同得条件S下重复n次试验,观察某一事件A就是否出现,称n次试验中事件A出现得次数nA为事件A出现得频数;称事件A出现得比例fn(A)=为事件A出现得概率:对于给定得随机事件A,如果随着试验次数得增加,事件A发生得频率fn(A)稳定在某个常数上,把这个常数记作P(A),称为事件A得概率。
(6)频率与概率得区别与联系:随机事件得频率,指此事件发生得次数nA与试验总次数n得比值,它具有一定得稳定性,总在某个常数附近摆动,且随着试验次数得不断增多,这种摆动幅度越来越小。我们把这个常数叫做随机事件得概率,概率从数量上反映了随机事件发生得可能性得大小、频率在大量重复试验得前提下可以近似地作为这个事件得概率
二、 概率得基本性质
1、基本概念:
(1)事件得包含、并事件、交事件、相等事件
(2)若A∩B为不可能事件,即A∩B=ф,那么称事件A与事件B互斥;
(3)若A∩B为不可能事件,A∪B为必然事件,那么称事件A与事件B互为对立事件;
(4)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于就是有P(A)=1—P(B)
2、概率得基本性质:
1)必然事件概率为1,不可能事件概率为0,因此0≤P(A)≤1;
2)当事件A与B互斥时,满足加法公式:P(A∪B)= P(A)+ P(B);
3)若事件A与B为对立事件,则A∪B为必然事件,所以P(A∪B)= P(A)+ P(B)=1,于就是有P(A)=1—P(B);
4)互斥事件与对立事件得区别与联系,互斥事件就是指事件A与事件B在一次试验中不会同时发生,其具体包括三种不同得情形:(1)事件A发生且事件B不发生;(2)事件A不发生且事件B发生;(3)事件A与事件B同时不发生,而对立事件就是指事件A 与事件B有且仅有一个发生,其包括两种情形;(1)事件A发生B不发生;(2)事件B发生事件A不发生,对立事件互斥事件得特殊情形、
三、古典概型及随机数得产生
1、(1)古典概型得使用条件:试验结果得有限性与所有结果得等可能性。
(2)古典概型得解题步骤;
①求出总得基本事件数;
②求出事件A所包含得基本事件数,然后利用公式P(A)=
四、几何概型及均匀随机数得产生
1、基本概念:
(1)几何概率模型:如果每个事件发生得概率只与构成该事件区域得长度(面积或体积)成比例,则称这样得概率模型为几何概率模型;
(2)几何概型得概率公式:
P(A)=;
(1) 几何概型得特点:1)试验中所有可能出现得结果(基本事件)有无限多个;2)每个基本事件出现得可能性相等、
第三部分: 统计案例
1、线性回归方程
①变量之间得两类关系:函数关系与相关关系;
②制作散点图,判断线性相关关系
③线性回归方程:(最小二乘法)
注意:线性回归直线经过定点。
2. 相关系数(判定两个变量线性相关性):
注:⑴>0时,变量正相关; <0时,变量负相关;
(2) 越接近于1,两个变量得线性相关性越强; 接近于0时,两个变量之间几乎不存在线性相关关系。
3、回归分析中回归效果得判定:
⑴总偏差平方与:⑵残差:;⑶残差平方与: ;⑷回归平方与:-;⑸相关指数 、
注:①得知越大,说明残差平方与越小,则模型拟合效果越好;
②越接近于1,,则回归效果越好。
4、独立性检验(分类变量关系):
随机变量越大,说明两个分类变量,关系越强,反之,越弱。
22列联表
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
K2=
展开阅读全文