1、矩阵代数概述 一、基本定义 定义1:矩阵: 一个矩阵就是一个矩阵数组,更准确地讲,一个m*n维矩阵就有m行和n列。正整数m被称为行维数,n被称为列维数。 定义2:方阵 方阵具有相同的行数和列数。 一个方阵的维数就是其行数和列数 定义3:向量 (1)一个1*m的矩阵被称为一个(m维)行向量,并可记为: (2)一个n*1的矩阵被称为一个(n维)列向量,并可记为: 定义4:对角矩阵 当一个方阵A的非对角元素都为零时,它就是一个对角矩阵。我们总能将一个对角矩阵写成: 定义5:单位矩阵和零矩阵 (1)用I(或为了强调维数而用In)表示的n*n单位
2、矩阵就是对角位置都是1,而其它位置都是0的对角阵; (2)一个用0表示的m*n零矩阵,就是所有元素都为零的m*n矩阵。它并不一定是方阵。 二、矩阵运算 1. 矩阵加法 两个都是m*n维的矩阵A和B可通过对应元素相加而相加: A+B=[aij]+[bij]。更准确地,有: 数值例子: 说明:不同维数的矩阵不能相加 2. 数乘 给定任意一个实数k(常被称为一个数量),数乘被定义为kA=[kaij] 数值例子: 3. 矩阵乘法 为了使矩阵A乘以矩阵B,得到AB,A的列维数和B的行维数必须相同。因此,令A为一个m*n矩阵,而B为一个n*p矩阵
3、于是,矩阵乘法被定义为: 换句话说,新矩阵AB的第(i,j)个元素,等于A中第i行的每个元素与B中第j列对应元素的乘积之和。如下简图可以使这个过程更一目了然: 第i行 第j列 第(i,j)个元素 数值例子:略 我们可以将一个矩阵与一个向量相乘。如果A是一个n*m矩阵,而y是一个m*1向量,那么Ay就是一个n*1的向量;如果x是一个1*n的向量,那么xA就是一个1*m的向量。 矩阵加法、数乘和矩阵乘法可以用各种方式组合,而且这些运算还满足几个熟悉的基本数值运算规则。在如下性质表中,A,B和C都具有运算所需要
4、的适当的维数,而a和b则是实数。这些性质中的大多数都很容易从定义得到说明。 矩阵乘法的性质: (1)( a+b)A= aA+bA; (2) a(A+B)= aA +aB; (3) (ab)A=a(bA); (4) a(AB)= (aA)B (5)A+B=B+A; (6)(A+B)+C=A+(B+C); (7)(AB)C=A(BC); (8)A(B+C)=AB+AC; (9)(A+B)C=AC+BC; (10)IA=AI=A; (11)A+0=0+A=A; (12)A-A=0; (13)A0=0A=0; (14)即使AB和BA都有定义,
5、仍然会AB¹BA 对于最后一个性质:如果A是一个n*m矩阵,而B是一个m*p矩阵,那么AB就有定义,而BA只有在n=p时,才有定义;如果A是一个m*n矩阵,而B是一个n*m矩阵,那么AB和BA都有定义,但除非A和B都是方阵,否则它们具有不同的维数。即便A和B都是方阵,除非在特殊情况下,否则AB¹BA仍成立。 定义6:转置 令A=[aij]表示一个m*n矩阵,用A'(读作A撇)表示A的转置,是将A的行和列互换后得到的n*m矩阵。我们可以把它写成A'=[aji]。 数值例子:略 转置的性质: (1) (A')'=A (2) ( aA)'= aA',
6、a为任意数; (3) (A+B)'=A'+B'; (4) (AB)'=B'A',A和B分别是m*n和n*p矩阵; (5) x'x=Sxi2,x是一个n*1向量; (6) 如果A是一个各行分别由1*k的向量a1,a2,...,an给出的n*k矩阵,所以可以写成: 于是:A'=(a1' a2' ... an') 定义7:对称矩阵 一个方阵是一个对称矩阵的充分必要条件是:A'=A 如果X是任何一个n*k矩阵,那么X'X总有定义并是一个对称矩阵,通过应用转置的第一和第四条性质即可看出。 分块矩阵的乘法 令A表示一个行由1*k向量a1,a
7、2,...,an给出的一个n*k矩阵,令B表示一个行由1*m向量b1,b2,...,bn给出的n*m矩阵: , 那么: 上式中,a'ibi对每个i,都是一个k*m矩阵。因此,A'B可写成n个k*m矩阵之和。作为一个特殊情形,有: 式中,a'iai对所有的i,都是一个k*k矩阵。 定义8:迹 一个矩阵的迹是只对方阵定义的一个很简单的运算。 对任何一个n*n矩阵A,用tr(A)表示矩阵A的迹,它是其主对角线元素之和。从数学上看,即: 迹的性质: (1)tr(In)=n; (2)tr(A')=tr(A); (3)tr(A+B
8、)=tr(A)+tr(B); (4)对任意数量a,都有tr(aA)= atr(A); (5)tr(AB)=tr(BA),A是m*n矩阵,而B是n*m矩阵 定义9:逆 对方阵而方,逆矩阵是一个很重要的概念 对一个n*n矩阵A,如果A-1A=AA-1=In,则A-1表示矩阵A的逆,在这种情形下,A就是可逆的或非奇异的。否则,它就是不可逆的,或奇异的。 逆的性质: (1) 如果逆存在,它是唯一的; (2) 如果a¹0,且A是可逆的,则(aA)-1=(1/a)A-1; (3) 如果A和B都是n*n可逆矩阵,则(AB)-1=B-1A-1; (
9、4) (A')-1= (A-1)'; 关于矩阵的逆的计算,这里从略。 三、线性独立与矩阵的秩 对一组具有相同维数的向量而言,知道其中一个向量是否可表示成其余向量的线性组合很重要。 定义10:线性独立 令{x1,x2,...,xr}是一组向量,若: a1x1+a2x2+...+arxr=0当且仅当a1=a2=...=ar=0时,它们才是线性独立的向量。如果上式对一组不全为零的系数成立,那么{x1,x2,...,xr}就是线性相关的。 {x1,x2,...,xr}线性相关的说法,等于说其中至少有一个向量可写成其他向量的线性组合。 定义11:秩 (
10、1)令A是一个n*m矩阵。用rank(A)表示矩阵A的秩,即A线性独立的最大列数; (2)如果A是一个n*m矩阵,且rank(A)=m,那么A就具有列满秩; 如果A是一个n*m矩阵,那么它的秩最大为m。如果一个矩阵的列构成一个线性独立集,那么它就是列满秩。比如3*2矩阵: 的秩最大为2,但实际上,它的秩为1,因为第二列是第一列的2倍。 秩的性质: (1)rank(A')=rank(A); (2)如果A是一个n*k矩阵,则rank(A)£min(n,k); (3)如果A是一个k*k矩阵,且rank(A)=k,则
11、A是满秩的。 四、二次型与正定型矩阵 定义12:二次型 令A为对称矩阵。与矩阵A相关的二次型,就是对所有n*1向量x定义的实值函数: 定义13:正定和半正定 (1)对于一个对称矩阵A,如果对除x=0外的所有n*1向量x,都有x'Ax>0,那么我们说A是正定的; (2)对于一个对称矩阵A,如果对所有n*1向量x,都有x'Ax³0,那么我们说A是半正定的。 如果一个矩阵是正定或半正定的,那它就自动被假定为对称的。 正定和半正定的性质 (1)正定矩阵的主对角元素都严格为正,而半正定矩阵的主对角元
12、素都非负; (2)如果A是正定矩阵,则A-1存在并正定; (3)如果X是一个n*k矩阵,则X'X和XX'都是半正定的; (4)如果X是一个n*k矩阵,且rank(X)=k,则X'X是正定的,因此也是满秩的。 五、幂等矩阵 定义14:幂等矩阵 令A为n*n对称矩阵,当且仅当AA=A时,我们称A为一个幂等矩阵。如 就量个幂等矩阵,直接相乘就可验证。 幂等矩阵的性质: 令A为n*n幂等矩阵: (1)rank(A)=tr(A); (2)A是半正定矩阵 我们可以构造一些很一般的幂等
13、矩阵。令X表示一个rank(X)=k的n*k矩阵。定义: PºX(X'X)-1X' MºIn-X(X'X)-1X'=In-P 于是,P和M是对称的幂等矩阵,且rank(P)=k和rank(M)=n-k。这些秩很容易通过利用性质(1)得到: tr(P) =tr[(X'X)-1X'X](根据迹的性质5) =tr(Ik)=k(根据迹的性质1)。 接下来,很容易得到: tr(M)=tr(In)-tr(P)=n-k 六、线性形式和二次型的微分 对于一个给定的n*1向量a,考虑对所有n*1向量x由f(x)=a'x定义的线性函数。 f对x
14、的导数是1*n阶偏导数向量,也就是: 对于一个n*n对称矩阵A,定义二次型g(x)=x'Ax,于是:¶g(x)/¶x=2x'A是一个1*n向量。 七、随机向量的矩和分布 为了利用矩阵推导OLS估计量的期望值和方差,我们需要定义一个随机向量的期望值和方差。 顾名思义,一个随机向量无非就是随机变量的一个向量。我们还需要定义多元正态分布。 定义15:期望值 如果y是一个n*1随机向量,用E(y)表示的y的期望值就是期望值向量: E(y)=[ E(y1), E(y2),... E(yn)]' 如果Z是n*m随机矩阵,则E(Z)是期望值为n*m矩阵: E(Z)=[
15、E(zij)] 期望值的性质: (1) 如果A为m*n矩阵,而b是一个n*1向量,且二者都是非随机的,那么:E(Ay+b)=AE(y)+b (2) 如果A是矩阵,而B是矩阵,且二者都是非随机的,那么:E(AZB)= AE(Z) B 方差-协方差矩阵 定义16:方差-协方差矩阵 如果y是一个n*1随机向量,用Var(y)表示y的方差-协方差矩阵,其定义为: 式中,sj2=Var(yj),sij=Cov(yi,yj) 换句话说,方差-协方差矩阵的主对角线上依次是y的每个元素的方差,而主对角线之外的则是协方差。另外,由于Cov(yi,yj) =Co
16、v(yj,yi),故方差-协方差矩阵是对称矩阵。 方差的性质: (1) 若a是一个n*1非随机向量,则Var(a'y)=a'Var(y)a³0; (2) 若Var(a'y)>0对所有a¹0都成立,则Var(y)是正定的; (3) Var(y)=E[(y-m)(y-m)'],其中m=E(y); (4) 若y的各个元素都不相关,则Var(y)是一个对角阵。而且若对j=1,2,...n,都有Var(yj)=s2,则Var(y)= s2In; (5) 如果A是一个m*n非随机矩阵,而b是一个n*1的非随机向量,那么Var(Ay+b)=AVar(y)A'。 多元正态分布 卡方分布 t分布 F分布






