一、协方差
1、协方差的定义
回想数学期望的性质之一,对于相互独立的随机变量
那么当
对于数学期望都存在的随机变量
为
2、协方差的计算方法
(1)若二维离散型随机变量
则
(2)若二维连续型随机变量
(3)直接按上述定义计算协方差往往比较麻烦, 在实际应用中常常用下面给出的计算公式来得到协方差:
3、协方差的性质
(1)对任意的正整数
(2)
(3)
(4)
(5)若
(6)若
(7)当
其中等号成立当且仅当
下面证明性质(7):
考虑一个实数
,构造随机变量 。计算 的方差: 展开平方项:
用协方差和方差的定义表示:
由于方差始终非负,即
对所有实数 成立,因此二次式: 这是一个关于
的二次不等式,其判别式必须非正: 化简判别式:
两边除以 4:
这就是需要证明的不等式。
等号成立当且仅当判别式等于零,即:
此时,二次方程
有唯一实数解 (假设 )。这意味着: 即:
这表明
和 之间存在严格的线性关系: 其中
, 。 类似地,如果
,可以表示为 。因此,等号成立当且仅当 和 之间存在严格的线性关系。 而这个性质,也为后面的相关系数的引出奠定基础。
(8)对任意的
二、相关系数
协方差也是有量纲的,而且其取值也依赖于它们的单位,为了克服这一缺点, 我们可以用上一节中所提到的,将随机变量标准化后,再来求它们的协方差, 于是就有了下面“相关系数”的定义。
1、相关系数的定义
对于随机变量
为
注意上述定义中,“
从而保证了
根据标准化变量的定义 (定义 4.2.2), 可知
其中
2、相关系数的性质
对于随机变量
- 若
和 相互独立, 则 , 但反之不然; , 其中等号成立当且仅当 与 之间有严格的线性关系 (即存在常数 , 使得 成立)。
相关系数和协方差反映的不是
上面的 “线性相关” 可从最小二乘法的角度再来加深理解。对随机变量
达到最小。通过求解,可知:
时,
若
当
当随机变量 X 和 Y 的相关系数
时,称
由相关系数及协方差定义, 可知“不相关”还可以用下面的任意一条来定义: