资源描述
地统计学知识点
精品文档
地统计学知识点
第一章 概论
1. 地统计学:以区域化变量理论为基础、以变异函数为主要工具,研究在空间分布上既有随机性和结构性,或空间相关和依赖性的自然现象的科学
2. 地统计学发展:
1951年 南非克里金和西舍尔提出克里金法
20世纪60年代(1962年)法国马特隆提出地统计学概念出版《应用地统计学论》,该书中第一次阐明了地统计学原理,地统计学诞生
1977年 美国Parker博士将地统计学概念引入中国
3. 地统计学与经典统计学的区别
经典统计学
地统计学
研究对象
研究纯随机变量
研究区域化变量
观测次数
变量可大量重复观测
变量不能重复实验
样本关系
样本相互独立
样本具有空间相关性
研究目的
研究样本的数字特征
研究样本的数字特征和区域化变量的空间分布特征
4. 地统计学研究内容: P3-4
空间估值(定义)、局部不确定性预测、随机模拟、多点地统计学(该方法产生于石油领域)
5. 地统计学适用范围
6. 地统计学应用领域(地质、土壤、生态、环境、气象)
第二章 地统计学基础
1. 总体抽取样本的四种方案(理解如何抽取样本):
随机抽样、机械抽样、分层抽样、分组抽样
2. 随机变量的数字特征(各定义) P15-21
a) 集中性度量(平均数):算数平均值、中数、众数、数学期望
b) 离散性度量(离散数):极差、离差、方差、协方差、矩、变异函数
c) 形态度量(形态数):偏度、峰度
期望:E(X)=xi∙Pi
设C是常数,则有E(C)=C
设X是一个随机变量,C是常数,则有E(CX)=CE(X)
设X、Y为两个随机变量,则有E(X+Y)=E(X)+E(Y)
设X,Y是相互独立的随机变量,则有E(XY)=E(X)E(Y)
方差:DX=EX-EX2=(xi-E)2∙Pi
设C是常数,则有D(C)=0
设X是一个随机变量,C是常数,则有D(CX)=C2D(X) D(C+X)=D(X)
设X、Y为两个随机变量,则有D(X+Y)=D(X)+D(Y)+ 2E{[X-E(X)][Y-E(Y)]}
若X,Y是相互独立的随机变量,则有D(X+Y)=D(X)+D(Y)
协方差:Cov(X, Y)=EXY-E(X)E(Y)
3. 相关关系:指事物之间的关系数值存在着一定的依存关系,即某一现象在其发展变化中,当数量上为一确定值时,与之有联系的其他现象可以有若干个数值与之对应,但这些值按某种规律在一定范围内进行波动。
4. 特点:一个变量的取值不能由另一个变量唯一确定,也不能用函数形式给予描述,但并不是无规律可行的。
5. 分类
① 所涉及变量的多少:单相关:两个变量之间的相关。复相关:三个或三个以上变量之间的相关。
② 按相关关系的表现形态:直线相关和曲线相关
③ 简单相关关系下按变量变动的方向:正相关:两个变量同方向变化。负相关:两个变量反方向变化。无相关(或零相关):两个量的变化互不影响。
6. 判断两变量是否存在相关性方法:散点图法、假设检验法
7. 简单相关系数概念及计算(掌握)
rxy=i=1n(xi-x)(yi-y)i=1n((xi-x))2×i=1n((yi-y))2
记 Lxy=i=1n(xi-x)(yi-y) Lxx=i=1n((xi-x))2 Lyy=i=1n((yi-y))2
则 rxy=LxyLxxLyy
r=0
不相关(不存在线性相关关系)
r<0
极低度相关
0.3≤r<0.5
低度相关
0.5≤r<0.8
中度相关
r≥0.8
高度相关
r=1
完全正相关或完全负相关
8. 偏相关:当研究某一个要素对另一个要素的影响或相关程度时,暂不考虑其它要素的影响,而单独研究那两个要素之间的相互关系的密切程度时,则称为偏相关。
9. 偏相关系数:用来度量偏相关程度的统计量。
性质:系数范围在-1和1之间;系数的绝对值越大,其偏相关程度越大;系数的绝对值小于等于由同一系列资料求得的负相关系数。
10. 一元线性回归模型步骤(掌握各步骤) P32-34
① 立一元线性回归方程:y=a+bx y是y的估计值 a为回归常数 b为回归系数
② 回归系数的估计。
③ 对一元回归方程的评价:拟合优度的评价,回归方程显著性检验。
11. 回归分析种类:
按自变量多少:一元回归、多元回归分析
按回归方程表现形式:线性回归、非线性回归分析
12. 回归分析与相关分析的区别和联系:
相关分析
回归分析
区别
相关分析研究的都是随机变量,不分自变量和因变量
回归分析研究的变量要定出自变量(确定的变量)与因变量(随机变量)。
联系
相关分析需要依靠回归分析,来表明现象数量相关的具体形式;
回归分析则需要依靠相关分析,来表明现象数量变化的相关程度。
13. 非线性回归模型:掌握P39 表2-2
① 数曲线y=debx 可以将其转化为直线形式: y'=a+bx', a=lnd
② 对数曲线y= a + blnx可以将其转化为直线形式:y'=a+bx'
③ 幂函数曲线y=dxb可以将其转化为直线形式: y'= a+bx' , 其中, a=lnd
④ 双曲线 1y=a+bx可转化为直线形式: y'= a+bx'
⑤ ⑤对于S型曲线y=1a+be-x ,可转化为直线形式:y'=a+bx'
14. 地理数据: 地理数据是用一定的测度标准去衡量地理要素而取得的地理信息
地理要素:构成地理环境整体的各个独立的、性质不同的组成部分
15. 地理数据分类:
间隔尺度数据
定量地理数据
比例尺度数据
地理数据
有序数据
定性地理数据
二元数据
名义尺度数据
16. 频率分析检验方法:频率分布直方图、正态QQplot分布
17. 离群值分析分为全局离群值(对于数据中的所有点具有很高或很低值的观测样点)、局部离群值(数据中对于其周围的点的值具有很高或很低观测值的样点)
18. 识别离群值方法(看书吧) P45-47
直方图识别全局离群值
半变异函数云图识别离群值
Voronoi图识别离群值(V多边形计算方法)
19. 全局趋势分析:指从总体上分析数据集在空间某一特定方向上的变化趋势
20. 空间自相关分析特点:随着样点距离的增大,变异函数值会逐渐增大,点云会从低逐渐升高
21. 各向异性:在不同的方向上,数据的变异情况呈现出差异的性质
第三章 区域化变量理论
1. 随机场:当随机函数依赖于多个自变量时,称为随机场
2. 区域化变量:以空间点x的三个直角坐标x u,x v,x w为自变量的随机场,称为区域化变量
区域化变量与普通随机变量的不同
a) 普通随机变量的取值按某种概率分布而变化
b) 区域化变量则根据其在一个域内的位置取不同的值。即区域化变量是普通随机变量在域内确定位置上的特定取值,它是随机变量与位置有关的随机函数。
c) 区域化变量有二维的、三维的。例:矿石品位、矿体厚度、大气污染浓度、气温、降水量、海拔高度、土壤重金属含量等等。
3. 区域化变量的性质:随机性和结构性
特性:空间局限性;不同程度的空间连续性;不同类型的各向异性
4. 协方差函数的概念:随机过程Z(t)在时刻t1和t2处两个随机变量Z(t1),Z(t2)的二阶混合中心矩
性质:先验方差不小于零;C(h)=C(-h),是一个偶函数;协方差函数的绝对值小于等于先验方差;γ(∞)=C(0);构成的变异函数矩阵必须是条件非负定矩阵。
计算 C*h=1N(h)[Z(xi)-Z(xi)]2 (PPT 33)
5. 变异函数的概念:变异函数是在任意方向α,相距|h|的两个区域化变量值Z(x)与Z(x+h)的增量的方差。
性质:h=0时,变异函数为零;γh=γ(-h),是一个偶函数;γ(h)≥0)即研究现象的变异函数值只能大于或等于零;|h|→∞时,γ(h)→C(0),即当空间上样点间距离无限大时,变异函数值接近先验方差;[-γ(h)]必须是一个条件非负定函数。
功能:变异函数通过“变程”反映变量的影响范围,“基台值”反映区域化变量在研究范围内变异的强度;不同方向上的变异函数图可反映区域化变量的各向异性;块金常数C0的大小可反映区域化变量的随机性大小;变异函数在原点处的性状可反映区域化变量不同程度的空间连续性
计算γ*h=12N(h)[Z(xi)-Z(xi+h)]2 (PPT 39~44)
6. 掌握P61-65的例题
7. 二阶平稳的条件 P66
a) 在整个研究区内,EZx=m(常数)存在,∀x
b) 在整个研究区内,区域化变量Z(x)的协方差函数存在且平稳(即只依赖于位移h,而与x无关)
CovZx,Zx+h=EZx∙Zx+h-EZx∙EZx+h=EZx∙Zx+h-m2=C(h)
8. 二阶平稳下对变异函数公式推导的推论 P66-67
9. 判断估计量好换的标准 P69
a) 无偏性 E[Z(xi)]=EZ*xi=m
b) 最优性(方差最小) σE2=varZxi-Z*xi⇒0
第四章 变异函数结构分析
1. 变异函数的理论模型(PPT 5~16)
a) 有基台值模型:
纯块金效应模型
球状模型
指数模型
高斯模型
线性有基台值模型
b) 无基台值模型
线性无基台值模型
幂函数模型
对数模型
(掌握各公式,为第五章克里金计算做准备)
2. 孔穴效应:当变异函数γ(h)在h大于一定的距离后,并非单调递增,而在具有一定周期波动时就显示出一种“孔穴效应”。
3. 掌握书上79页 表4-1
4. 结构分析: 构造一个变异函数模型对于全部有效结构信息作定量化的概括,以表征区域化变量的主要特征。结构分析的主要方法是套合结构
5. 单一方向上套合: 每一个变异函数代表同一方向上一种特定尺度的变异,并可以用不同的变异函数理论模型来拟合,即单一方向的套合结构
6. 各向异性的种类:几何异向性、带状异向性 P86
① 几何异向性(当区域化变量在不同方向上表现出变异程度相同而连续性不同时称为几何异向性)
② 带状异向性(当区域化变量在不同方向上变异性差异不能用简单几何变换得到时,就称为带状异向性)
7. 结构分析的步骤 P91-94
① 域化变量选择
② 数据的获取与审议
③ 数据的统计分析
④ 变异函数的计算
⑤ 变异函数的结构分析——各向异性
⑥ 理论变异函数模型的最优拟合及检验
⑦ 变异函数理论模型的专业分析
第五章 克里金法
1. 克里金法:又称为空间局部估计或空间局部插值法,克立格法是建立在变异函数理论及结构分析基础上,在有限区域内对区域化变量的取值进行线性无偏最优估计的一种方法。
种类:简单克立格法;普通克立格法;泛克立格法;对数正态克立格法;指示克立格法;概率克立格;析取克立格法;协同克立格法
2. 最合理的估计方法必须满足的条件 P98
3. 克里金估值的过程:数据检查;模型拟合;模型诊断;模型比较
4. 简单克里金法 掌握书上102页的例题
5. 普通克里金法 掌握书上115页的例题
6. 泛克里金法
漂移:非平稳区域化变量Z(x)的数学期望,在任一点x上的漂移就是该点上区域化变量Z(x)的数学期望
涨落:是一个数学期望为0的区域化变量,可认为涨落是围绕漂移m(x)摆动的随机误差。
理解126页的例题
7. 非线性克里格法
1) 对数正态克里格法
2) 指示克里格法 指示克里格法步骤 P130
3) 析取克里格法
8. 协同克里格法
1) 协同区域化变量理论中,满足二阶平稳假设、内蕴假设的协同区域化变化条件 P145-146
2) 交叉协方差函数性质:
当k=k’时 Ckk'h=Ck(h) γkk'h=γk(h)
交叉变异函数性质:
交叉变异函数关于k和k '对称,即γkk'h=γk'k(h)
交叉变异函数关于h和-h对称,即γkk'h=γkk'(-h)
3) 交叉协方差函数和交叉变异函数计算公式 P148 PPT(95、96) 掌握书上149页例题
4) 协同克里格法使用条件 P154
a) 由协同克里格法的定义和公式推导可知,协同克里格法在以下条件下使用:
i. 估计邻域中待估变量至少有一个样品数据。
ii. 待估变量与其它变量的数据不在同一支撑上。
b) 协同克里格法在以下条件下不使用:
i. 估计邻域中,待估变量若没有样品数据,无偏条件αk0nk0λαk0=1不成立。
ii. 可以证明,在同一支撑上只利用待估变量的数据进行估值时,和同时使用待估变量与其它变量进行估值,其精度是相同的。特别是当待估变量与其它变量的数据支撑雷同时,协同克里格方差即为普通克里格方差。此时用普通克里格估值即可,不必实施复杂的协同克里格法
收集于网络,如有侵权请联系管理员删除
展开阅读全文