概述

什么是相关性?它和我们日常的生活有什么关系?通过阅读本文,你将会了解到相关性的知识,并可以利用这个知识指导自己的工作和生活。 本文下面将要介绍如下内容

1.什么是相关性

2.如何判断两个事件有相关性

3.如何计算相关性

4.什么是线性相关性

5.什么是自相关性

什么是相关性

那么什么是相关性呢? 比如说打算买入一个公司的股票之前,我们可能会去考察这个公司的业绩,通过它的财报、业务范围、股东情况等去了解,这些都了解之后才会决定是否购买这家公司的股票,这就是一个相关性的例子。再最终决定是否购买之前,如何衡量每一个因素所占的比重呢?研究这种问题的方法,就称为相关性问题。

如何判断两个事件是否具备相关性

我们在现实的世界中会有很多因素影响我们做决策,比如上文提到是否买入A公司的股票这个事情,我们就会考虑那些因素。那么我们如何衡量这些因素是否真正的对于我们做当前的决策产生了影响呢?我们可以把要分析的两个事件分别抽象成为A和B,我们要研究A和B之间的关系,就要考察如下的情况:

随着A上升,B也上升,说明有正相关性;
随着A上升,B在下降,说明有负相关性;
随着A下降,B在上升,说明有负相关性;
随着A下降,B在下降,说明有正相关性;
随着A的上升或者下降,B没有变化,说明没有相关性;

另外我们需要识别出一些伪相关性的场景,比如随着A的升高B也升高,但是二者之间没有必然的关系,比如孩子的每年长高多少和小树苗每年长高多少,孩子的每年都会长高,小树苗也会每年长高,但是二者之间并没有什么关系。

如何计算相关性

我们如何计算两个事件是否有相关性呢?比如有两个事件X和Y,我们可以按照如下的步骤计算X和Y的相关系数:

方差可以理解为所有的数据距离平均数的距离,方差越大说明数据的质量不好,方差越小,数据的质量越好,我们可以基于样本计算出平均值,然后基于平均值计算出方差;
标准差是方差的开跟号后的数值,意义和方差一致;
协方差表示两个事件之间的协同关系,比如二者是正相关还是负相关;
相关系数用协方差除以X和Y的标准差的乘积,该值的绝对值小于等于1;

什么是线性相关性

我们假设有X和Y两个事件,如果他们二者之间存在关系: Y = aX+b, 那么我们就说他们二者存在线性关系。

什么是自相关性

比如计算事件Xt和事件Xt-k事件的相关,二者之间相差k-1个事件,如果需要计算同一个事件的前后相关性就是自相关性。研究这个有什么作用? 比如我们在研究股票的走势、在K8S中根据CPU做动态伸缩的时候就会起到作用。