线性相关分析
对于二元连续型总体(X,Y),人们研究其两个分量之间的关系,途径之一是采用(随机)自变量X的如下线性函数作为(随机)因变量Y的模拟:
=β+βX (48.3.1)
线性模拟,在每一个观测单元上的取值,即总体Y的线性模拟值
,与总体X在同一个观测单元上的取值X之间具有与(48.3.1)式同样的线性关系:
=β+βx (48.3.1)
x—y平面上用(48.3.1)式表示的直线称为总体Y关于总体X的一元回归直线。
为了由总体()的样本观测值(
)=(
)用最小二乘法求得截距β和斜率β的估计值b和b,从而求得线性模拟
的估计值
=b+bx,需要首先定义样本观测值
与
的相关矩l,协方差S和相关系数r:
最小二乘法是求得满足下式的b0和b的方法:=min,其中:对i=1—n(48.3.3)
i=b0+bx,是线性模拟
=β+βx的估计值
首先由=0推出b=
,将其代入1=0,解出
。下列简单的推导表明,这样求得Q的驻点是Q的最小值点:
以上推导过程最后一步“≥”的等号当且仅当用求得的驻点
(b,b)=()代入Q(b,b)时成立。可以把(*)式最左端与最后一个等式右端改写如下:令
=b+
上式表明,Q=Q()在
-Q空间的图形是以(
,lyy-
)为顶点,开口向上的椭圆抛物面,其顶点是最低点,即Q的最小值点,如图48—1所示。
图48—1
这样,就得到了(48.3.1)式的最小二乘估计:
,其中:
(48.3.1)2直线(48.3.1)2式通过点(
)。又由(*)式可知:minQ=l-
lyy(1-r) (48.3.5)由上式可知相关系数具有如下性质:
(1)|r|≤1,这是因为minQ≥0。
(2)如果r=±1,则与
完全线性相关:
由于minQ=Q(±
X,±
)=0,所以对i=1—n,y=
=
±
(x-X),n个点(xi,y),i=1—n完全位于回归直线上。
(3)如果r=0,则与
线性无关:
由于minQ=Q(,0)=l,所以对i=1—n,
≡
,不随x改变。回归直线
=
不能表达
与
之间或者存在某种非线性关系或者没有关系。
(4)|r|越大,与
线性相关越密切:
minQ越小,表示n个点(x,y1),i=1-—n越接近回归直线。
(5)r>0称为正相关;r<0称为负相关:
b>0,随x增大而增大,表示y随x增大有增大的趋势;b<0,
随x增大而减小,表示y随xi增大有减小的趋势。
样本观测值的相关系数r表示样本观测值]线性相关的密切程度以及正、负相关,这跟总体相关系数ρ对于总体Y与X所表示的概念是一样的。推断ρ
0并且用r作为它的估计值,是以|r|>r(n-2)为前提。只有在这种情形,(48.3.1)1式中的斜率
,才有必要用(48.3.1)式作为β、β以及(48.3.1)式的最小二乘估计。r(n-2)可以查“检验相关系数ρ=0的临界值(r)表”得到,n-2是自由度。相关分析的步骤如表48—1所示。
表48—1
可以使用SHARP-5002计算器的如下程序求得r与b、b以及ρ的置信度为1—α的置信区间:
(1)—→STAT
在上例中,r=0.87,u=1.96,n=30,算得ρ的95%置信区间是(0.7424,0.9367)。置信度1-α表示可靠性。u可以查“标准正态分布的双侧分位数(u)表”得到,一般常用u=1.96。
对于三元连续型总体(X,X,Y),如果研究工作需要以X1和X为(随机)自变量,而以Y为(随机)因变量,则类似于(48.3.1)式和(48.3.1)式,有:
=β0+βX+βX(48.3.7)
x=β0+βx+βx(48.3.7)1
xx-y立体空间中的平面(48.3.7)1式称为总体Y关于总体X、X的二元回归平面。它的最小二乘估计是:
x=b+bX+bX,其中:b=
-b
1—b2X2(48.3.7)2
以上求b1和b2的公式右端各量的足码1与2分别是总体X的取值x1与总体X2的取值x2的代号。这里假设行列式=ll-l
>0。计算
,
,
;l,l=l,l;l,l是使用总体
的样本观测值
=
。
线性相关的密切程度用下列复相关系数表示:
上式中的b和b是β1和β2的最小二乘估计值,由(48.3.7)式求出。r和r.1称为偏相关系数:r从r中消除了的影响;r从r中消除了
的影响。上述的“影响”来自
与
的(线性)相关系数r。
(编者:刘长安 审者:孙尽善)
-
- 妲己如此残忍!刽子手为何却不忍心落刀
- 相信大家都看过封神榜,其中讲述了一个武王伐纣的神话故事,传说因为纣王的昏庸,导致朝廷中的忠臣被害,各地百姓民不聊生,皇宫里宫女死伤
-
- 甲骨文用辞及福祐辞
- “用”字在甲骨文中出现超过两千次,属极为常见的字词之一。“用”字大部分出现在祭辞中,但也有不少与祭祀无关的文例;另外还有几百条
-
- 秦穆公的“西部大开发”
- 比晋文公稍晚一些时候,秦穆公在西方也建立了自己的霸业(再次提醒,因为秦穆公一直是在西部混,本书就未把他列入春秋五霸)。秦人为嬴姓,本
-
- 孔子门人曾子故里在哪里
- 曾子又叫曾参,是春秋末年鲁国人,山东作为孔孟之乡,人文色彩浓厚,曾子也是山东省嘉祥县人,这点从史记和建筑遗迹上都可以看出来。
-
- 董卓生平
- 董卓诞于永和五年(141年),生来具备过人的怪力,能在马上左右开弓。年少时游历羌胡聚居地,与豪帅结交。后从事耕作,豪帅来访时以谋生的
-
- 齐宣王拜颜斶
- 齐宣王田辟疆(公元前301年),战国时齐国国君,齐威王之子,妫姓。公元前320年继齐威王为田氏齐国第五代国君,公元前319—前301年在位。齐宣