Skip to main content

相关性的一些概念学习笔记

Submitted by taotao on Sat, 01/25/2020 - 16:18

概述

我们经常会听到相关性这个词,它是如何来的?我们如何更好的理解它呢?比如我们要买入A公司的股票,我们会去考察A公司的业绩如何,就会去关注它的企业年度财报、公司业务经营范围、股东成员股权分配情况等,这些都了解之后才会决定是否购买这家公司的股票,这就是一个相关性的例子。我们如何衡量每一个因素在决定我们是否购买股票这个事情中所占据的比例? 通过阅读本文我们会了解如下内容:

  1. 如何判断两个事件是否具备相关性;
  2. 什么是线性相关性;
  3. 什么是自相关性;

通过上述内容的理解,你将会掌握如何识别出两个事件之间是否具备相关性,如果具备相关性,那么二者的相关性的因数是多少?掌握这个知识后,可以帮组我们更好的对这个世界作出科学的分析和预测,从而可以指导我们的工作和生活。

如何判断两个事件是否具备相关性

我们在现实的世界中会有很多因素影响我们做决策,比如上文提到是否买入A公司的股票这个事情,我们就会考虑那些因素。那么我们如何衡量这些因素是否真正的对于我们做当前的决策产生了影响呢?我们可以把要分析的两个事件分别抽象成为A和B,我们要研究A和B之间的关系,就要考察如下的情况:

  1. 随着A上升,B也上升,说明有正相关性;
  2. 随着A上升,B在下降,说明有负相关性;
  3. 随着A下降,B在上升,说明有负相关性;
  4. 随着A下降,B在下降,说明有正相关性;
  5. 随着A的上升或者下降,B没有变化,说明没有相关性;

另外我们需要识别出一些伪相关性的场景,比如随着A的升高B也升高,但是二者之间没有必然的关系,比如孩子的每年长高多少和小树苗每年长高多少,孩子的每年都会长高,小树苗也会每年长高,但是二者之间并没有什么关系。 

我们如何计算两个事件是否有相关性呢?比如有两个事件X和Y,我们可以按照如下的步骤计算X和Y的相关系数:

  1. 方差,可以理解为所有的数据距离平均数的距离,方差越大说明数据的质量不好,方差越小,数据的质量越好,我们可以基于样本计算出平均值,然后基于平均值计算出方差;
  2. 标准差,是方差的开跟号后的数值,意义和方差一致;
  3. 协方差,表示两个事件之间的协同关系,比如二者是正相关还是负相关;
  4. 相关系数,用协方差除以X和Y的标准差的乘积,该值的绝对值小于等于1;

什么是线性相关性

我们假设有X和Y两个事件,如果他们二者之间存在关系: Y = aX+b, 那么我们就说他们二者存在线性关系。 

什么是自相关性

比如计算事件X 和 事件Xt-k  事件的相关性,二者之间相差k-1个事件,如果需要计算同一个事件的前后相关性就是自相关性。研究这个有什么作用? 比如我们在研究股票的走势、在K8S中根据CPU做动态伸缩的时候就会起到作用。

Add new comment

Plain text

  • No HTML tags allowed.
  • Lines and paragraphs break automatically.
  • Web page addresses and email addresses turn into links automatically.