才子佳人博客

我的故事我讲述

皮尔森相关系数Pearson correlation coefficient
 
来源:blog.csdn.net  编辑:xjh  2018-05-04

皮尔森相关系数(Pearson correlation coefficient)也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数,是最常用的一种相关系数。记为ρ,用来反映两个变量X和Y的线性相关程度。公式定义如下:


物理意义:

皮尔森相关系数反映了两个变量的线性相关性的强弱程度,ρ的绝对值越大说明相关性越强。当ρ>0时,表明两个变量正相关,即一个变量值越大则另一个变量值也会越大;当ρ<0时,表明两个变量负相关,即一个变量值越大则另一个变量值反而会越小;当ρ=0时,表明两个变量不是线性相关的(注意只是非线性相关),但是可能存在其他方式的相关性(比如曲线方式);当ρ=1和-1时,意味着两个变量X和Y可以很好的由直线方程来描述,所有样本点都很好的落在一条直线上。

皮尔森相关系数是用来反应俩变量之间相似程度的统计量,在机器学习中可以用来计算特征与类别间的相似度,即可判断所提取到的特征和类别是正相关、负相关还是没有相关程度。

现在用两个向量测试一下:

vector1 = [2,7,18,88,157,90,177,570]

vector2 = [3,5,15,90,180, 88,160,580]

运行结果为0.998,可见这两组数是高度正相关的。

来源:
https://blog.csdn.net/lin453701006/article/details/53224347
https://blog.csdn.net/AlexMerer/article/details/74908435
http://blog.sina.com.cn/s/blog_69e75efd0102wmd2.html


分类:网络日志| 查看评论
相关文章
文章点击排行
本年度文章点击排行
发表评论:
  • 昵称: *
  • 邮箱: *
  • 网址:
  • 评论:(最多100字)
  • 验证码: