Python 机器(算法)学习(一)
皮尔森相关系数(Pearson Correlation Coefficient)----又称积矩相关系数,是一种线性相关系数。反映两个变量线性相关程度的统计量。相关系数用r表示,n表示样本量。r表示两个变量间线性相关强弱程度。r越大相关性越强。
sum1 =
sum([prefs[p1][it]
for it
in si])
sum2 =
sum([prefs[p2][it]
for it
in si])
sum1Sq =
sum([
pow(prefs[p1][it],
2)
for it
in si])
sum2Sq =
sum([
pow(prefs[p2][it],
2)
for it
in si])
pSum =
sum([prefs[p1][it]*prefs[p2][it]
for it
in si])
num = pSum-(sum1*sum2/n)
den = sqrt((sum1Sq-
pow(sum1,
2)/n)*(sum2Sq-
pow(sum2,
2)/n))
if den==
0:
return 22
r=num/
den
return r
简单的理解为 :
数据偏离中心点的距离.等于变量减掉平均数再除以标准差
转载请注明原文地址: https://ju.6miu.com/read-9971.html