粮食产量影响因素的多元线性回归分析
Multiple Linear Regression Analysis of Factors Affecting Grain Yield

作者: 郏然然 , 韩 旭 :安庆师范大学数学与计算科学学院,安徽 安庆;

关键词: 粮食产量分析多元线性回归显著性Grain Yield Analysis Multiple Linear Regression Significance

摘要:
本文主要介绍了如何使用多元线性回归方法对粮食产量的影响因素进行分析和,使用IBM SPSS Statistics软件对求出的结果进行分析,并对分析结果结合实际提出相关建议。

Abstract: This paper mainly introduces how to use multivariate linear regression method to analyze the in-fluencing factors of grain yield, and use IBM SPSS Statistics software to carry out analysis, and put forward relevant suggestions based on the analysis results.

1. 引言

2018年中共中央、国务院印发了《乡村振兴战略规划(2018-2022年)》,其中要求贯彻落实加快农业现代化步伐,提升农业科技创新水平。农业也是国家发展的基础 [1] ,粮食产量更是我国经济发展不可缺少的指标。相关资料显示,国家近几年来的粮食产量在不断提高,而粮食产量与哪些因素有关,关系如何等问题便成了要进一步提高粮食产量必须要解决的问题。

多元线性回归 [2] 是统计学中常用的分析方法之一,主要用于分析因变量与多个自变量之间的具体关系。一些文献中分析了多元线性回归与其他分析方法的区别等,并举出实例。本文根据近十年数据对粮食产量的影响因素进行分析,求出相关的回归方程,继而提出合理性建议。

2. 多元线性回归相关理论

2.1. 多元线性回归方程

多元线性回归分析是研究多个自变量与一个因变量之间的非确定关系的一种方法,其基础的方程结构为:

f ( x t ) = a 0 + a 1 x 1 t + + a n x n t + μ t

其中,因变量f(xt)为f(x)的第t次的取值,自变量xit为第i个变量xi的第t的取值,ai为回归方程的回归系数, ( i ( 1 , 2 , , n ) ) μ t 表示第t次的误差且满足 μ t ~ N ( 0 , σ 2 ) 。若 μ t = 0 ,则称f(xt)为理论回归方程。

在多元线性回归方程中,模型必须满足的条件为:

1) 自变量对因变量有显著的影响,并呈现出非确定关系(线性关系);

2) 样本容量 > 回归系数的个数;

3) 残差服从正态分布。

2.2. 回归系数估计(OLS)

残差平方和公式为:

Q ( β 0 , β 1 , , β k ) = ( y t β 0 β 1 x 1 t β n x n t )

即,若Q取最小值,则Q对 β 0 , β 1 , β n 的偏导数为0。下将Q对 β 0 , β 1 , β n 求偏导数,并令偏导数为0,可得到如下回归方程组:

n β 0 + β 1 x 1 t + + β n x n t = y t

β 0 x 1 t + β 1 x 1 t 2 + + β n x 1 t x n t = x 1 t y t

β 0 x n i + β 1 x 1 t x n t + + β n x n t 2 = x n t y t

求解上述方程组即可得到需求的回归系数 β 0 , β 1 , β n

2.3. 总方差估计及显著性检验

在多元线性回归模型中总方差的计算公式为:

S 2 = e t 2 m n

其中,m为样本总数,n为回归系数, e t 2 为残差平方和。且总方差S2为随机误差项方差 σ 2 的无偏估

计,总方差越小表明误差越小,回归方程越准确。

本文使用数学软件 [3] IBM SPSS Statistics对所求解的回归方程做显著性检验,即分析方程的R平方和标准残差等数据。

3. 根据数据构建回归方程

将样本土地上的播种面积、有效灌溉面积、化肥施用量、机械总动力、成灾面积作为自变量,该样本地区的粮食产量作为因变量,从而构建相应的回归方程。

3.1. 构建回归方程

数据如表1所示:

Table 1. Food production data for 2008-2017

表1. 2008年~2017年粮食产量数据

下面判断数据能否使用多元线性回归。根据多元线性回归方程的使用条件:

1) 如表2所示,自变量对因变量有显著的影响,并呈现出非确定关系(线性关系);

Table 2. Pearson relevance

表2. Pearson相关性

2) 10 (样本容量) > 6(系数个数);

3) 如图1所示,残差服从正态分布。

Figure 1. Standardized residual diagram

图1. 标准化残差图

则可设五个自变量(粮食作物播种面积、农业机械总动力、有效灌溉面积、农用化肥施用折纯量和受灾面积)与因变量(粮食产量)的回归函数如下:

f ( x ) = β 0 + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + β 5 x 5 + μ

其中,x1为粮食作物播种面积,x2为农业机械总动力,x3为有效灌溉面积,x4为农用化肥施用折纯量,x5为受灾面积,且f(x)为粮食产量, β 0 , β 1 , β 2 , β 3 , β 4 , β 5 为回归系数, μ 为误差,数据量为十组(即2008年至2017年的六个指标,来源于国家统计局)。

3.2. 求解回归方程

本文使用IBM SPSS Statistics对表2数据进行线性回归分析后,绘制相关的偏回归图,如图2所示:

Figure 2. Partial regression diagrams of dependent and independent variables

图2. 因变量与各自变量偏回归图

观察可得化肥施用量与粮食产量的相关性最高。

下用量化形式寻找上述五个变量与粮食产量之间的关系对表1中的数据进行线性回归后可解得 β 0 , β 1 , β 2 , β 3 , β 4 ,即得到回归方程为:

f ( x ) = 114085.247 2.018 x 1 + 0.155 x 2 + 1.099 x 3 + 14.134 x 4 0.081 x 5

可得到常数 β 0 的值为114085.247,粮食作物播种面积系数 β 1 的值为-2.018,农业机械总动力系数 β 2 的值为0.155,有效灌溉面积系数 β 3 的值为1.099,农用化肥施用折纯量 β 4 的值为14.134,受灾面积系数 β 5 的值为−0.081。即粮食产量与有效灌溉面积、农业机械总动力和农用化肥施用折纯量为正相关,与播种面积成负相关的主要原因为且与化肥施用量相关性最强,也符合科学的发展。

3.3. 显著性检验

根据IBM SPSS Statistics线性回归结果如表3所示:

Table 3. Test indicators and data values

表3. 检验指标与数据值

其标准残差为0.667。其拟合程度 R 2 的值为0.998,大于0.95。即,此线性回归与模型的拟合程度良好。

4. 结合实际给出相关建议

总所周知,农业是一个国家至关重要的产业之一,而粮食生产量则是农业的重要指标之一,所以粮食产量的提高对国民经济的发展有重要作用。

可根据本文所得到的线性回归方程得到如下建议:

1) 通过线性回归方程可以看出,化肥施用量与粮食产量的正相关性最强,所以化肥可以有效促进粮食产量的提高。但在施用化肥的过程中要适量,否则会污染环境、降低土地肥力等,不利于长期发展。

2) 有效灌溉面积与粮食产量相关性较强,所以在粮食生产过程中,应有适量的水分,即在雨水不充足时采用人工降雨等措施。

3) 根据数据显示,播种面积与粮食产量成负相关,主要原因为生产技术的提高使得,即使是减小播种面积也可以增加粮食的产量。即生产力的发展对粮食产量的提高有重大作用,可节约农业用地,使土地得到更合理的利用。所以应该合理的规划已有用地,提高生产质量,进而提高粮食产量。

4) 成灾面积与粮食产量成负相关,即应尽量减少成灾面积,减少粮食产量的损失。如及时给农作物驱赶害虫,洪涝灾害时及时排水等。

文章引用: 郏然然 , 韩 旭 (2019) 粮食产量影响因素的多元线性回归分析。 应用数学进展, 8, 1088-1093. doi: 10.12677/AAM.2019.86125

参考文献

[1] 李妍. 中国粮食生产因素及地区差异分析[J]. 经济研究导刊, 2009(13): 45-46.

[2] 向东进, 李宏伟, 刘小雅. 实用多元统计分析[M]. 武汉: 中国地质大学(武汉)出版社, 2005.

[3] 单良, 胡勇. 基于Eviews, Excel, Spss的回归分析比较[J]. 统计与决策, 2006(4): 150-152.

分享
Top