碧波液压网 欢迎你,游客。 登录 注册

计量技术中相关系数的理解及应用

版权信息:站内文章仅供学习与参考,如触及到您的版权信息,请与本站联系。

  

  引言

  在自然和社会现象中,变量之间存在着某种依存关系,即为统计关系,也叫相关关系。相关系数是反映变量之间相关程度的重要数字特征。在误差理论与数据处理领域,相关系数有着广泛的应用。相对于其他概念,相关系数在实际的认识和使用中存在一定难度。因此,正确地理解和运用相关系数,对于数据处理尤为重要。

  1 相关系数的定义引出及其理解

  在计量技术的理论中,“相关系数”先后在误差合成、测量不确定度合成以及回归分析[1]中用到,概念是先用后提,没有数学铺垫,让人感到有些费解。鉴于其中的相关系数主要是指线性相关,如果从数据处理的基本方法——最小二乘法出发,在回归直线的拟合过程中引出和定义相关系数,就可以为我们定性、定量地理解相关系数奠定基础。

  回归分析中,用直线y=ax+b去拟合n个点(xi,yi)(i=1,2,Λ,n)时,可以先作出散点图。根据最小二乘思想,就是要寻找适当的a,b值使为最小。

  将Q对a,b分别求偏导数,并令其为零。则当Q达到最小时:

  由于(4)式左边是非负数,现设其左边的式子为ρ2,则ρ2值的大小应与散点接近回归直线的程度有关,即ρ2可以表示变量x与y的线性相关程度。因此,定义

  显然有1-ρ2≥0,即|ρ|≤1。其中,当|ρ|=1时,由(6)式可知,即,此时散点都分布在回归直上;当

此时散点都分布在回归直线附近,所以|ρ|越接近于1,线性相关程度越大。

  分析回归直线的斜率的表达式及相关系数ρ的定义式,可知

  当ρ>0时,a>0,两变量正相关;当ρ<0时,a<0,两变量负相关;当|ρ|→0时,a→0,回归直线倾向于与x轴平行。所以,|ρ|越接近于0,线性相关程度越小。由于任何两个随机变量x与y的分布均客观存在,其方差Dx与Dy也是确定的,所以(5)式又可以写为:

  cov(x,y)既有类似于方差的形式,又有x与y的共同参与,称之为x与y的协方差。ρ无量纲,而cov(x,y)有量纲。cov(x,y)与ρ成正比,所以协方差也是一个可以描述随机变量间相关程度的一个量[2],但依赖于x与y的度量单位。因此实际中,通常用ρ而不用cov(x,y)来判断 x 与 y 的相关程度。对于随机变量x、y,如果存在某种相关关系,对于x取值范围内的每一个值,与之对应的y值通常都不只一个,而是若干个,它们都在y的取值范围内。因此,当x遍取其取值范围内的一切值时,对应的点就是一些随机点(x,y)。在概率论中,当这些散点的布列趋势与一条直线的形状相像时,就说x、y存在线性关系。这种相像的程度,完全取决于ρ的大小。这就是相关关系存在的根本原因。当然,也可能存在其他的相关关系。可以采用参数、非参数的表示方法,用广义相关系数衡量非线性相关。

你没有登陆,无法阅读全文内容

您需要 登录 才可以查看,没有帐号? 立即注册

标签:
点赞   收藏

相关文章

发表评论

请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。

用户名: 验证码:

最新评论