失眠网,内容丰富有趣,生活中的好帮手!
失眠网 > R语言用线性模型进行臭氧预测: 加权泊松回归 普通最小二乘 加权负二项式模型 多

R语言用线性模型进行臭氧预测: 加权泊松回归 普通最小二乘 加权负二项式模型 多

时间:2023-08-25 02:20:27

相关推荐

R语言用线性模型进行臭氧预测: 加权泊松回归 普通最小二乘 加权负二项式模型 多

最近我们被客户要求撰写关于线性模型的研究报告,包括一些图形和统计输出。在这篇文章中,我将从一个基本的线性模型开始,然后尝试找到一个更合适的线性模型。

数据预处理

由于空气质量数据集包含一些缺失值,因此我们将在开始拟合模型之前将其删除,并选择70%的样本进行训练并将其余样本用于测试:

N.train <- ceiling(0.7 * nrow(ozone))trainset <- sample(seq_len(nrow(ozone)), N.train)testset <- setdiff(seq_len(nrow(ozone)), trainset)

普通最小二乘模型

作为基准模型,我们将使用普通的最小二乘(OLS)模型。在定义模型之前,我们定义一个用于绘制线性模型的函​​数:

plot.linear.model <- function(model, test.preds = NULL, test.labels = NULL, test.only = FALSE) {test.residuals <- test.labels - test.predstest.res.df <- data.frame("x" = test.labels, "y" = test.preds,"x1" = test.labels, "y2" = test.preds + test.residuals,"DataSet" = "test")plot.res.df <- rbind(plot.res.df, test.res.df)# annotate model with R^2 valuer.squared <- rsquared(test.preds, test.labels)}ggplot() return(p)}

现在,我们使用lm并研究特征估计的置信区间来建立OLS模型:

confint(model)

## 2.5 % 97.5 %## (Intercept) -1.106457e+02 -20.88636548## Solar.R7.153968e-03 0.09902534## Temp 1.054497e+00 2.07190804## Wind -3.992315e+00 -1.24576713

我们看到模型似乎对截距的设置不太确定。让我们看看模型是否仍然表现良好:

查看模型的拟合度,有两个主要观察结果:

高臭氧水平被低估预计臭氧含量为负

下面让我们更详细地研究这两个问题。

高臭氧水平被低估

从图中可以看出,当臭氧在[0,100]范围内时,线性模型非常适合结果。但是,当实际观察到的臭氧浓度高于100时,该模型会大大低估该值。

应该问一个问题,这些高臭氧含量是否不是测量误差的结果?考虑到典型的臭氧水平,测量值似乎是合理的。最高臭氧浓度为168 ppb(十亿分之一),城市的典型峰值浓度为150至510 ppb。这意味着我们应该关注离群值。低估高臭氧含量将特别有害,因为高含量的臭氧会危害健康。让我们调查数据以确定模型为何存在这些异常值的问题。

直方图表明残差分布右尾的值确实存在问题。由于残差不是真正的正态分布,因此线性模型不是最佳模型。实际上,残差似乎遵循某种形式的泊松分布。为了找出最小二乘模型的拟合对离群值如此差的原因,我们再来看一下数据。

##OzoneSolar.R Wind Temp## Min. :110.0 Min. :207.0 Min. :2.300 Min. :79.00 ## 1st Qu.:115.8 1st Qu.:223.5 1st Qu.:3.550 1st Qu.:81.75 ## Median :120.0 Median :231.5 Median :4.050 Median :86.50 ## Mean :128.0 Mean :236.2 Mean :4.583 Mean :86.17 ## 3rd Qu.:131.8 3rd Qu.:250.8 3rd Qu.:5.300 3rd Qu.:89.75 ## Max. :168.0 Max. :269.0 Max. :8.000 Max

R语言用线性模型进行臭氧预测: 加权泊松回归 普通最小二乘 加权负二项式模型 多重插补缺失值

如果觉得《R语言用线性模型进行臭氧预测: 加权泊松回归 普通最小二乘 加权负二项式模型 多》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。