【机器学习】回归误差:MSE、RMSE、MAE、R2、AdjustedR2+方差、协方差、。。。

阅读: 评论:0

【机器学习】回归误差:MSE、RMSE、MAE、R2、
AdjustedR2+⽅差、协⽅差、。。。
我们通常采⽤MSE、RMSE、MAE、R2来评价回归预测算法。
1、均⽅误差:MSE(Mean Squared Error)
其中,为测试集上真实值-预测值。
def rms(y_test, y):
an((y_test - y) ** 2)
2、均⽅根误差:RMSE(Root Mean Squard Error)
可以看出,RMSE=sqrt(MSE)。
3、平均绝对误差:MAE(Mean Absolute Error)
以上各指标,根据不同业务,会有不同的值⼤⼩,不具有可读性,因此还可以使⽤以下⽅式进⾏评测。
4、决定系数:R2(R-Square)
def R2(y_test, y_true):
return 1 - ((y_test - y_true)**2).sum() / ((y_true - an())**2).sum()
其中,分⼦部分表⽰真实值与预测值的平⽅差之和,类似于均⽅差 MSE;分母部分表⽰真实值与均值的平⽅差之和,类似于⽅差 Var。
根据 R-Squared 的取值,来判断模型的好坏,其取值范围为[0,1]:
如果结果是 0,说明模型拟合效果很差;
如果结果是 1,说明模型⽆错误。
⼀般来说,R-Squared 越⼤,表⽰模型拟合效果越好。R-Squared 反映的是⼤概有多准,因为,随着样本数量的增加,R-Square必然增加,⽆法真正定量说明准确程度,只能⼤概定量。
5、校正决定系数(Adjusted R-Square)
其中,n 是样本数量,p 是特征数量。
Adjusted R-Square 抵消样本数量对 R-Square的影响,做到了真正的 0~1,越⼤越好。
python中可以直接调⽤
ics import mean_squared_error #均⽅误差
ics import mean_absolute_error #平⽅绝对误差
ics import r2_score#R square
#调⽤
MSE:mean_squared_error(y_test,y_predict)
RMSE:np.sqrt(mean_squared_error(y_test,y_predict))
MAE:mean_absolute_error(y_test,y_predict)
移民瑞典后悔死了
R2:r2_score(y_test,y_predict)
Adjusted_R2::1-((1-r2_score(y_test,y_predict))*(n-1))/(n-p-1)
⽅差、协⽅差、标准差(标准偏差/均⽅差)、均⽅误差、均⽅根误差(标准误差)、均⽅根值
本⽂由博主经过查阅⽹上资料整理总结后编写,如存在错误或不恰当之处请留⾔以便更正,内容仅供⼤家参考学习。
⽅差(Variance)
⽅差⽤于衡量或⼀组数据的离散程度,⽅差在在统计描述和概率分布中有不同的定义和计算公式。①概率论中⽅差⽤来度量和其(即)之间的偏离程度;②统计中的⽅差(样本⽅差)是每个样本值与全体样本均值之差的平⽅值的,代表每个变量与总体均值间的离散程度。
概率论中计算公式
离散型随机变量的数学期望:碧水湾温泉度假村电话
---------求取期望值
连续型随机变量的数学期望:
----------求取期望值
其中,pi是变量,xi发⽣的概率,f(x)是概率密度。
-
--------求取⽅差值
统计学中计算公式
总体⽅差,也叫做有偏估计,其实就是我们从初⾼中就学到的那个标准定义的⽅差:新疆地图最新版
-----------求取总体均值
其中,n表⽰这组数据个数,x1、x2、……xn表⽰这组数据具体数值。
------------求取总体⽅差
其中,为数据的平均数,n为数据的个数,为⽅差。
样本⽅差,⽆偏⽅差,在实际情况中,总体均值是很难得到的,往往通过抽样来计算,于是有样本⽅差,计算公式如下
--------------求取样本⽅差
此处,为什么要将分母由n变成n-1,主要是为了实现⽆偏估计减⼩误差,请阅读。
协⽅差(Covariance)
协⽅差在和中⽤于衡量两个变量的总体。⽽是协⽅差的⼀种特殊情况,即当两个变量是相同的情况。协⽅差表⽰的是两个变量的总体的,这与只表⽰⼀个变量误差的不同。 如果两个的变化趋势⼀致,也就是说如果其中⼀个⼤于⾃⾝的期望值,另外⼀个也⼤于⾃⾝的期望值,那么两个变量之间的协⽅差就是正值。 如果两个变量的变化趋势相反,即其中⼀个⼤于⾃⾝的期望值,另外⼀个却⼩于⾃⾝的期望值,那么两个变量之间的协⽅差就是负值。
其中,E[X]与E[Y]分别为两个实数随机变量X与Y的数学期望,Cov(X,Y)为X,Y的协⽅差。
标准差(Standard Deviation)
标准差也被称为标准偏差,在中⽂环境中⼜常称,是数据偏离均值的平⽅和平均后的⽅根,⽤σ表⽰。标准差是⽅差的算术平⽅根。标准差能反映⼀个数据集的离散程度,只是由于⽅差出现了平⽅项造成量纲的倍数变化,⽆法直观反映出偏离程度,于是出现了标准差,标准偏差越⼩,这些值偏离平均值就越少,反之亦然。
------------求取样本标准差
其中,  代表所采⽤的样本X1,X2,...,Xn的均值。
-------------求取总体标准差
其中, 代表总体X的均值。
例:有⼀组数字分别是200、50、100、200,求它们的样本标准偏差。
= (200+50+100+200)/4 = 550/4 = 137.5
= [(200-137.5)^2+(50-137.5)^2+(100-137.5)^2+(200-137.5)^2]/(4-1)
营口百姓网样本标准偏差 S = Sqrt(S^2)=75
贵州荔波天气预报均⽅误差(mean-square error, MSE)
均⽅误差是反映与被估计量之间差异程度的⼀种度量,换句话说,参数估计值与参数真值之差的平⽅的期望值。MSE可以评价数据的变化程度,MSE的值越⼩,说明预测模型描述实验数据具有更好的精确度。
雾凇岛景点介绍均⽅根误差(root mean squared error,RMSE)
均⽅根误差亦称,是均⽅误差的算术平⽅根。换句话说,是观测值与(或模拟值)偏差(⽽不是观测值与其平均值之间的偏差)的平⽅与观测次数n⽐值的平⽅根,在实际测量中,观测次数n总是有限的,真值只能⽤最可信赖(最佳)值来代替。标准误差对⼀组测量中的特⼤或特⼩误差反映⾮常敏感,所以,标准误差能够很好地反映出测量的。这正是标准误差在⼯程测量中⼴泛被采⽤的原因。因此,标准差是⽤来衡量⼀⾃⾝的,⽽均⽅根误差是⽤来衡量同真值之间的偏差。
均⽅根值(root-mean-square,RMES)
均⽅根值也称作为或有效值,在数据统计分析中,将所有值平⽅求和,求其均值,再开平⽅,就得到均⽅根值。在物理学中,我们常⽤均⽅根值来分析噪声。
⽐如幅度为100V⽽占空⽐为0.5的⽅波信号,如果按计算,它的电压只有50V,⽽按均⽅根值计算则有70.71V。这是为什么呢?举⼀个例⼦,有⼀组100伏的电池组,每次供电10分钟之后停10分钟,也就是说占空⽐为⼀半。如果这组电池带动的是10Ω电阻,供电的10分钟产⽣10A 的电流和1000W的功率,停电时电流和功率为零。

本文发布于:2023-05-26 12:14:08,感谢您对本站的认可!

本文链接:http://www.035400.com/whly/1/436983.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   程度   样本   总体   模型   均值   误差
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2024-2030 Comsenz Inc.Powered by © 文化旅游网 滇ICP备2022007236号-403 联系QQ:1103060800网站地图