单指标模型的加权复合分位数回归
Single-Index Weighted Composite Quantile Regression

作者: 杨紫微 * , 姜 荣 :东华大学理学院,上海;

关键词: 单指标模型复合分位数回归分位数回归Single-Index Model Composite Quantile Regression Quantile Regression

摘要:
加权复合分位数回归(WCQR)是在分位数回归基础上发展起来的一种稳健估计,并且其效率与半参数极大似然估计几乎相同,因而越来越受到人们的关注。近年来,WCQR方法已经被推广到了单指标模型中,但是目前单指标模型的WCQR方法都涉及到算法的迭代问题,其严重影响运算速度。为解决以上问题,本文提出一种非迭代的估计算法,并给出估计量的渐近分布。最后通过模拟和实证研究验证了本文所提出方法的有效性。

Abstract: Weighted composite quantile regression (WCQR), a robust estimation based on quantile regression, is becoming increasingly popular due to the nearly same efficiency as the semi-parametric maximum likelihood estimator. Recently, WCQR method has been promoted extensively to sin-gle-index model. However, the recent WCQR methods for single-index model are necessarily itera-tive, which seriously affects the computing speed. We propose a non-iterative estimation algorithm, and derive the asymptotic distribution of the proposed estimator. The simulation and empirical studies are conducted to illustrate the finite sample performance of the proposed methods.

1. 引言

单指标模型作为处理高维非参数估计和“维数灾祸”问题的常用方法,在诸多领域得到了广泛的应用,如Härdle [1] (1993)研究了计量经济学中的离散选择分析和生物计量学中的剂量反应模型,其具体形式如下:

Y = g 0 ( X T γ 0 ) + ε (1.1)

其中 Y 为响应变量, X 是一个p维的协变量; g 0 ( · ) 是未知函数; γ 0 是未知参数。为了模型的可识别性,本文假定 γ 0 = 1 γ 0 的第一项为正数,其中 · 表示欧式范数, ε 是期望为0的误差向量。

对模型(1.1)研究的主要任务是对未知参数 γ 0 的估计,例如Härdle&Stoker [2] (1989)提出了平均导数法(ADE);Carroll [3] 等(1997)利用局部线性法得到未知参数并给出了它们的渐近分布;Xia & Härdle [4] (2006)提出了最小平均方差估计算法(MAVE),该方法最初是为了降维而被Xia等 [5] (2002)引入;Liu等 [6] (2013)提出了局部线性回归模型的参数估计法。最近,Jiang等 [7] (2016a)研究了加权复合分位数回归,且其继承了分位数回归的稳健性。使用上述算法估计参数部分和非参部分都需要迭代,因此许多学者研究了非迭代算法,例如Wang等 [8] (2010)提出了两步算法;Liang等 [9] (2010)提出了无需迭代的最小二乘估计算法;Christou & Akritas [10] (2016)提出了Nadaraya-Watson分位数回归算法。

本文所提出的算法与WCQR有着密切的联系,而WCQR是在复合分位数回归(CQR)上发展起来的,Zou &Yuan [11] (2008)首次使用CQR来估计经典线性回归模型中的未知参数,并证明了CQR的渐进效率与最小二乘比不低于70%。CQR是各个分位数回归上的等权之和。一般来说,等权不是最优的,因此Jiang等 [12] (2012)在复合分位数回归的基础上进一步提出了数据驱动的加权CQR方法(WCQR),并通过理论和数值模拟对比,验证了WCQR方法优于CQR,只有当误差密度为Logistic分布或接近Logistic分布时,标准CQR方法才具有较好的统计性质(见Zhao & Lian [13] 2016)。

为了提高估计效率,本文基于WCQR良好的理论性质提出了NIWCQR算法。该方法在计算速度上明显改善,且其估计量渐近于Jiang等 [7] (2016a)的WCQR。因此,本文所提出的算法是对现有方法一种有价值的补充。

本文其余部分结构如下:在第2节中,本文介绍了模型(1.1)的非迭代WCQR方法,且给出主要理论结果;在第3节中给出了数值模拟的结果;第4节是定理的证明;第5节是结论。

2. 单指标模型的非迭代WCQR方法

在这一部分,本文将提出单指标模型的非迭代WCQR方法(NIWCQR)。

2.1. NIWCQR方法

理论上,在单指标模型(1.1)中的参数真值 γ 0 满足下式:

γ 0 = arg min γ k = 1 K w k E [ ρ τ k { Y Q τ k ( Y | X T γ ) } ] (2.1)

其中 Q τ k ( Y | X T γ ) = c k + g ( X T γ ) W = ( w 1 , , w K ) T 是与 X 相互独立的权重向量,且 W = 1 c k = F 1 ( τ K ) ,其中 F ( · ) 代表模型误差 ε 的累积分布函数。 ρ τ k ( r ) = τ k r r I ( r < 0 ) ( k = 1 , , K ) 是k分位点上的损失函数,其中 0 < τ 1 < τ 2 < < τ K < 1

为解决 γ 0 的参数估计,一般都需要进行迭代,本文定义 H τ k ( t | γ ) = E [ Q τ k ( Y | X ) | X T γ = t ] 其中, ( k = 1 , , K ) ,因此,在单指标模型中

Q τ k ( Y | X T γ 0 ) = Q τ k ( Y | X ) = H τ k ( X T γ 0 | γ 0 ) k = 1 , , K

那么 γ 0 满足下式

γ 0 = arg min γ k = 1 K w k E [ ρ τ k { Y H τ k ( X T γ | γ ) } ] (2.2)

{ Y i , X i } i = 1 n 是来自 { Y , X } 独立同分布的样本,则(2.2)式右边的表达式可近似转化为 1 n i = 1 n k = 1 K w k ρ τ k { Y i H τ k ( X i T γ | γ ) } 。对于每一个k我们可以得到 H τ k ( · | γ ) 的Nadaraya-Watson估计值 H ^ τ k ( t | γ ) (见Christou & Akrites [10] (2016))

H ^ τ k ( t | γ ) = i = 1 n Q ^ τ k ( Y | X i ) K h k ( X i T γ t ) i = 1 n K h k ( X i T γ t ) (2.3)

其中 K h k ( · ) = k ( · / h k ) K ( · ) 是核函数, h k 是窗宽,且一般 Q τ k ( Y | X ) = inf { y : P ( Y y | X = X ) τ k } ( k = 1 , , K ) 是未知的,因此需要一个估计值来替代 Q τ k ( Y | X ) ,则由D-vine copula (Kraus & Czado [14] (2017))方法可得

Q ^ τ k ( Y | X ) = F ^ Y 1 ( C ^ F Y | F 1 , , F P 1 ( τ | F ^ 1 ( x 1 ) , , F ^ p ( x p ) ) ) k = 1 , , K

其中 F ^ j ( x j ) = 1 n + 1 i = 1 n I ( X i j x j ) ( j = 1 , , p ) 具体细节可参考Kraus & Czado [10] (2017)的3.2节。在(2.3)式中得到 H ^ τ k ( t | γ ) 后,未知参数的估计值可简化为

γ ¯ = arg min γ 1 n i = 1 n k = 1 K w k ρ τ k { Y i H ^ τ k ( X i T γ | γ ) } (2.4)

在模型(1.1)得到参数 γ 0 的估计值 γ ^ 的基础上,再根据Jiang [15] (2016b)的局部加权复合分位数回归(LWCQR) 估计出 g 0 ( · ) 的值,即对任一内点u

( a ^ 1 , , a ^ K , b ^ ) = arg min ( a 1 , , a K , b ) 1 n i = 1 n k = 1 K { Y i a k b ( X i T γ ^ u ) } K h ( X i T γ ^ u ) (2.5)

进而 g ^ ( u | γ ^ ) = k = 1 K v k a ^ k ,其中权重向量 V = ( v 1 , , v K ) T 满足 k = 1 K v k = 1 k = 1 K v k c k = 0

2.2. 渐近性

假设 f ( · ) 是模型误差 ε 的密度函数, f U ( · ) U = X T γ 0 的边缘密度函数, K ( · ) 是一个对称的核函数,

定义 μ j = u j K ( u ) d u v j = u j K 2 ( u ) d u R 1 ( W ) = { k = 1 K w k f ( c k ) } 2 k = 1 K k = 1 K w k w k τ k k

R 2 ( V ) = k = 1 K k = 1 K v k v k τ k k f ( c k ) f ( c k ) τ k k = τ k Λ τ k τ k τ k h max = max 1 k K { h k } h min = min 1 k K { h k }

定理2.1 假设定理证明中的条件C1-C4成立,S是非奇异的, n n h max 4 0 n h min ,则

n ( γ ^ γ 0 ) L N ( 0 , S 1 R 1 (W) )

其中 L 代表依分布收敛,且 S = E { g 0 ( X T γ 0 ) 2 [ X E ( X | X T γ 0 ) ] [ X E ( X | X T γ 0 ) ] T }

从定理2.1中,易得出 γ ^ 的渐近方差只依赖于 R 1 ( W ) 中的 W 。因此, γ ^ 的最佳权重为

W o p t = arg min W R 1 ( W ) = ( f T Ω 2 f ) 1 / 2 Ω 1 f (2.6)

其中 f = ( f ( c 1 ) , , f ( c K ) ) T Ω 是一个 K × K 阶矩阵, ( k , k ) 处的元素 Ω k k = τ k k 。则(2.4)式中的最优权重 R 1 ( W o p t ) = ( f T Ω 1 f ) 1

n ( γ ^ γ 0 ) L N ( 0 , S 1 ( f T Ω 1 f ) 1 ) (2.7)

定理 2.2 假设定理证明中的条件C1-C4成立,如果 n h 0 ,则对任一内点u有

n h { g ^ ( u | γ ^ ) g 0 ( u ) 1 2 g 0 ( u ) μ 2 h 2 } L N ( 0 , V 0 R 2 ( V ) f U (u) )

容易看出, g ^ ( u | γ ^ ) 中的偏差不受权向量 V 的影响,而方差项只依赖于 V ,即最优权重 g ^ ( u | γ ^ ) 的最小渐近方差有关,则

V o p t = arg min W R 2 ( V ) = ( r T A 1 r ) A 1 1 ( 1 T A 1 r ) A 1 r ( r T A 1 r ) ( 1 T A 1 1 ) ( 1 T A 1 r ) 2 (2.8)

其中 r 是K维列向量,第K个元素为 c k ,且 1 是一个K维的单位列向量,A是一个 K × K 维的矩阵,在 ( k , k ) 处的元素为 τ k k / ( f ( c k ) f ( c k ) ) ( k , k = 1 , , K ) 。故在最优化权值下 g ^ ( u | γ ^ ) 的渐近方差为 f U 1 ( u ) v 0 R 2 ( V o p t )

注2.2 定理2.1提出的估计实现了与半参数最大似然估计几乎相同的效率,(Jiang [7] (2016a))。特别地,当 w = ( 1 , , 1 ) 时,WCQR方法是标准的CQR方法,见Jiang [12] (2012)。定理2.2的结果及最佳带宽h的选择参考Jiang [15] (2016b)。

注2.3 从(2.6)和(2.8)可以看出最佳权重向量 W 相对比较复杂,且涉及误差密度函数 f ( c k ) ( k = 1 , , K ) 。一般 f ( c k ) 是未知的,而非参数密度估计方法可以提供f的一致估计 f ^ ,如基于估计误差 ε ^ 的核平滑估计,具体细节可以参考Jiang [7] (2016a)的2.3节。

3. 模拟研究

在本节中,我们首先使用蒙特卡罗模拟研究来评估所提出程序的有限样本性能,然后通过实际数据分析证明所提出方法的实用性。Tian [16] (2016)提出了新的AIC和BIC的定义来确定复合分位数中K的值,然而,具有不同K的CQR方法的在模拟中的表现非常相似。 此外,从Jiang [7] (2016a)的表1表2可以看出 K = 9 是对WCQR方法的一个很好的选择。 因此,我们在模拟中选择 K = 9 。本文中所有的程序都是基于R语言编写的。在本节中,包含了7种方法进行比较,除本文中的方法,还有以下6种:

1) MAVE方法(参考Xia & Härdle [4] (2006));

2) τ = 0.5 的分位数回归(QR0.5) (参考Wu等 [6] 2010);

3) WCQR方法其中 K = 9 (WCQR9) (参考Jiang et al. [7] 2016a);

4) 非迭代的最小二乘估计(NILSE) (参考Wang & Wu [17] (2013));

5) 非迭代的的 τ = 0.5 的分位数回归(NIQR0.5) (参考Christou & Akritas [10] 2016);

6) 非迭代的复合分位数回归方法其中 K = 9 (NICQR9),其中 W 1

其中(1)~(3)方法需要迭代,(4)~(6)的估计过程不需要迭代。

3.1. 模拟例子

样本数 n = 200 的数据集由以下模型产生

Y = sin { π ( X T γ 0 ) } + 0.2 ε (3.1)

其中 X 是在 [ 0 , 1 ] 10 上的均匀分布,并且 γ 0. j = 1 / 10 , j = 1 , , 10 。在本例的数值模拟中,考虑了误差 ε

三种分布,且所有的模拟运行500次。

Table 1. Simulation results of model (3.1)

表1. 模型(3.1)的模拟结果

表1中包含了均值平方误差( MSE = ( γ ^ γ 0 ) T ( γ ^ γ 0 ) )与平均计算时间t,从表中可以看出,NIWCQR

方法的估计值渐近于WCQR,并且非迭代的算法比相应的迭代算法效率高。

本文用平均误差(ASE)来评判 g ^ ( · ) 的优劣, ASE = 1 n g r i d i = 1 n g r i d { g ^ ( u i ) g ( u i ) } 2 ,其中 u i i = 1 , , n g r i d n g r i d = 200 。从表1可以看出,本文提出所算法的ASE渐近于迭代算法的ASE。

3.2. 实际例子:波士顿房价

作为一个应用,我们把本文所提出的方法(NIWCQR)应用到波士顿房价数据中。波士顿房价数据包含了14个变量,506个观测值,其中medv作为因变量。目前,已经有许多学者研究过此数据集,并发现medv与RM,TAX,PTRATIO,LSTAT的关系(见Wu等 [17] ,(2010))。在本例中,我们将关注4个协变量:

RM:每家住户的平均房间数;

TAX:全部价值物业税(美元) $10,000;

PTRATIO:街区学生与教师的比例;

LSTAT:地位较低的人口(%)。

我们先对TAX和LSTAT进行对数变换,且中心化。本文将使用下面的单指标模型来拟合数据集

在本实例中使用了平均绝对误差(MAE)来评价七种估计方法的优劣,其中, MAE = 1 506 i = 1 506 | y i y ^ i |

y ^ i y i 的估计值。在表2中我们总结了上述模型的估计系数。值得注意的是,在四个协变量中PTRATIO对房价的影响最小,而LSTAT对房价的影响最大。表2还给出了所有估计方法的MAE和t (计算时间)。

Table 2. Estimated Single Index Factor for Boston House Prices and MSE

表2. 波士顿房价的单指标系数估计和MSE

表2可以看出,本文的方法(NIWCQR9)在拟合波士顿房价上的效果比其他的非迭代方法好,并且NIWCQR的计算效率比WCQR高。图1显示了估计的 g ( . ) 以及真实的数据。从图1中可以看出NIWCQR9非常地接近真实值。

Figure 1. Estimated single index composite quantile regression for Boston housing data. The dots are the observations and the curve is the estimated link function

图1. 波士顿房价的单指标复合分位数回归。圈是观察值,曲线是估计的连接函数

4. 定理证明

为了证明所提出估计量的渐近性质,需要以下条件。

C1. 核函数 K ( . ) 是一个对称的有界密度函数,并且有Lipschitz连续的二阶微分。

C2. U = X T γ 的密度函数是正的并且在 γ 0 的一个领域内对 γ 一致连续。 X T γ 0 的密度函数连续有界。

C3. 函数 g 0 ( · ) 是连续有界的二次可微函数。

C4. 模型的误差 ε 的密度函数 f ( · ) 是正的。

注A.1 条件C1-C4是单指标模型中的一般条件,见Wu等 [18] (2010),Jiang等 [7] [15] (2016a, 2016b)。

引理1:假设条件C1-C2成立,并且 n h max 4 0 ,则对于任意的 γ

1 n i = 1 n [ H ^ τ k ( X i T γ | γ ) H τ k ( X i T γ | γ ) ] = ο p (1)

证明:

1 n i = 1 n [ H ^ τ k ( X i T γ | γ ) H τ k ( X i T γ | γ ) ] = 1 n i = 1 n j = 1 n Q ^ τ k ( Y | X j ) K h k { ( X i X j ) T γ } j = 1 n K h k { ( X i X j ) T γ } 1 n i = 1 n H τ k ( X i T γ | γ ) = 1 n 3 / 2 h k i = 1 n j = 1 n Q ^ τ k ( Y | X j ) K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) 1 n i = 1 n H τ k ( X i T γ | γ )

= { 1 n 3 / 2 h k i = 1 n j = 1 n Q ^ τ k ( Y | X j ) K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) } + { 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) 1 n i = 1 n H τ k ( X i T γ | γ ) } T 1 + T 2

其中 f ^ γ ( t ) = ( n h k ) 1 i = 1 n K h k ( X i T γ t ) 并且

T 1 = 1 n 3 / 2 h k i = 1 n j = 1 n Q ^ τ k ( Y | X j ) K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f γ ( X i T γ )

T 2 = 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) 1 n i = 1 n H τ k ( X i T γ | γ )

我们先证明 T 1 = ο p ( 1 )

T 1 = 1 n 3 / 2 h k i = 1 n j = 1 n Q ^ τ k ( Y | X j ) K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) 1 n 3 / 2 h k i = 1 n j = 1 n Q τ K ( Y | X j ) K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) + 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) = 1 n 3 / 2 h k i = 1 n j = 1 n [ Q ^ τ k ( Y | X j ) Q τ k ( Y | X j ) ] K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) + 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } [ 1 f ^ γ ( X i T γ ) 1 f γ ( X i T γ ) ] T 11 + T 12

其中

T 11 = 1 n 3 / 2 h k i = 1 n j = 1 n [ Q ^ τ k ( Y | X j ) Q τ k ( Y | X j ) ] K h k { ( X i X j ) T γ } f ^ γ ( X i T γ )

T 12 = 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } [ 1 f ^ γ ( X i T γ ) 1 f γ ( X i T γ ) ]

sup X X | Q ^ τ k ( Y | X ) Q τ k ( Y | X ) | = O p ( n 1 / 2 ) 可得 T 11 = ο P ( 1 ) ,见Rémillard等 [19] (2017)。在C2和 n h max 4 = ο p ( 1 ) T 12 = ο p ( 1 ) 的条件下, T 1 = ο P ( 1 )

接下来证明 T 2 = ο p ( 1 )

T 2 = 1 n 3 / 2 h k i = 1 n j = 1 n Q τ k ( Y | X j ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) 1 n 3 / 2 h k i = 1 n j = 1 n H τ k ( X i T γ | γ ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) + 1 n 3 / 2 h k i = 1 n j = 1 n H τ k ( X i T γ | γ ) K h k { ( X i X j ) T γ } f γ ( X i T γ ) 1 n i = 1 n H τ k ( X i T γ | γ ) = 1 n 3 / 2 h k i = 1 n j = 1 n [ Q τ k ( Y | X j ) H τ k ( X i T γ | γ ) ] K h k { ( X i X j ) T γ } f ^ γ ( X i T γ ) + 1 n 3 / 2 h k i = 1 n j = 1 n H τ k ( X i T γ | γ ) K h k { ( X i X j ) T γ } [ 1 f γ ( X i T γ ) 1 f ^ γ ( X i T γ ) ] = 1 n 3 / 2 h k i = 1 n j = 1 n [ Q τ k ( Y | X j ) H τ k ( X i T γ | γ ) ] K h k { ( X i X j ) T γ } f γ ( X i T γ ) + ο P (1)

由U-统计性质和已知条件 n h max 4 = ο ( 1 ) ,我们可以得到 T 2 = ο P ( 1 )

定理2.1的证明:假设 γ ^ * = n ( γ ^ γ 0 ) γ * = n ( γ γ 0 ) ,则最小化下式可以得到 γ ^ *

L n ( γ * ) = i = 1 n k = 1 K w k { ρ τ k ( Y i , τ k * H ˜ τ k ( X i | γ * / n + γ 0 ) ) ρ τ k ( Y i , τ k * ) }

其中 H ˜ τ k ( X i | γ * / n + γ 0 ) = H ^ τ k ( X i T γ | γ ) H ^ τ k ( X i T γ 0 | γ 0 ) ,并且

Y i , τ k * = Y i H ^ τ k ( X i T γ 0 | γ 0 ) + O p ( n 1 )

这时 L n ( γ * ) 可以写成

L n ( γ * ) = E [ L n ( γ * ) | χ ] i = 1 n k = 1 K w k { ρ τ k ( Y i , τ k * ) E [ ρ τ k ( Y i , τ k * ) | χ ] } H ˜ τ k ( X i | γ * / n + γ 0 ) + R n (γ*)

其中 χ 是设计矩阵, R n ( γ * ) 是余项。类似Fan等 [20] (1994)中的证明方法,我们可以得到 R n ( γ * ) = ο p ( 1 ) 。则

E [ L n ( γ * ) | χ ] = i = 1 n k = 1 K w k E [ ρ τ k ( Y i , τ k * H ˜ τ k ( X i | γ * / n + γ 0 ) ) ρ τ k ( Y i , τ k * ) | χ ] = i = 1 n k = 1 K w k E [ ρ τ k ( Y i , τ k * ) | χ ] H ˜ τ k ( X i | γ * / n + γ 0 ) + 1 2 i = 1 n k = 1 K w k E [ ρ τ k ( Y i , τ k * ) | χ ] H ˜ 2 τ k ( X i | γ * / n + γ 0 ) + ο P (1)

并且 E [ ρ τ k ( Y i , τ k * ) | X ] = f ε ( c k ) + ο p ( n 1 / 2 ) 。通过引理1,我们可以得到

L n ( γ * ) = k = 1 K w k i = 1 n ρ τ k ( Y i , τ k * ) H ˜ τ k ( X i | γ * / n + γ 0 ) + 1 2 k = 1 K w k f ε ( c k ) i = 1 n H ˜ 2 τ k ( X i | γ * / n + γ 0 ) + ο p ( 1 ) = k = 1 K w k i = 1 n ρ τ k ( Y i , τ k * ) [ H ^ τ k ( X i T ( γ * / n + γ 0 ) | γ * / n + γ 0 ) H ^ τ k ( X i T γ 0 | γ 0 ) ] + 1 2 k = 1 K w k f ε ( c k ) i = 1 n [ H ^ τ k ( X i T ( γ * / n + γ 0 ) | γ * / n + γ 0 ) H ^ τ k ( X i T γ 0 | γ 0 ) ] + ο p (1)

由引理1,我们可以得到

i = 1 n [ H ^ τ k ( X i T ( γ * / n + γ 0 ) | γ * / n + γ 0 ) H ^ τ k ( X i T γ 0 | γ 0 ) ] = i = 1 n [ H τ k ( X i T ( γ * / n + γ 0 ) | γ * / n + γ 0 ) H τ k ( X i T γ 0 | γ 0 ) ] + ο P ( n 1 / 2 )

并且

H τ k ( X i T ( γ * / n + γ 0 ) | γ * / n + γ 0 ) H τ k ( X i T γ 0 | γ 0 ) = γ * n H τ k ( X i T γ | γ ) γ | γ 0 + O p ( n 1 ) = 1 n g 0 ( X i T γ 0 ) ( X i E [ X | X T γ 0 ] ) T γ * + O p ( n 1 )

因此,

L n ( γ * ) = W n γ * + 1 2 { γ * } T { k = 1 K w k f ε ( c k ) } S n γ * + ο p (1)

其中

W n = 1 n i = 1 n k = 1 K w k ρ τ k ( Y i , τ k * ) g ( X i T γ 0 ) ( X i E [ X | X T γ 0 ] ) T

S n = 1 n i = 1 n { g ( X i T γ 0 ) } 2 ( X i E [ X | X T γ 0 ] ) ( X i E [ X | X T γ 0 ] ) T

易得 S n = S + ο P ( 1 ) ,因此

L n ( γ * ) = W n γ * + 1 2 { γ * } T { k = 1 K w k f ε ( c k ) } S γ * + ο p (1)

根据Pollard [21] (1991)的凸引理,可得 L n ( γ * ) 的二次近似对任意紧集 Θ 中的 γ * 保持一致。因此,可得下式

γ ^ * = { k = 1 K w k f ( c k ) } 1 S 1 W n + ο p (1)

由于Cramér-Wald定理和中心极限定理对于 W n 成立且 V a r ( W n ) k = 1 q k = 1 q w k w k τ k k S ,因此定理得证。

定理2.2的证明:此证明类似于Jiang等 [15] (2016b)定理1的证明。

5. 结论

基于单指标模型,我们提出了一种NIWCQR方法,它是一种非迭代的估计算法,因此我们可以更快地得到估计值。

文章引用: 杨紫微 , 姜 荣 (2019) 单指标模型的加权复合分位数回归。 统计学与应用, 8, 766-776. doi: 10.12677/SA.2019.85087

参考文献

[1] Härdle, W., Hall, P. and Ichimura, H. (1993) Optimal Smoothing in Single-Index Models. The Annals of Statistics, 21, 157-178.
https://doi.org/10.1214/aos/1176349020

[2] Härdle, W. and Stoker, T. (1989) Investing Smooth Multiple Regression by the Method of Average Derivatives. Journal of the American Statistical Association, 84, 986-995.
https://doi.org/10.1080/01621459.1989.10478863

[3] Carroll, R.J., Fan, J., Gijbels, I. and Wand, M.P. (1997) Generalized Partially Linear Single-Index Models, Journal of the American Statistical Association, 92, 477-489.
https://doi.org/10.1080/01621459.1997.10474001

[4] Xia, Y. and Härdle, W. (2006) Semi-Parametric Estimation of Partially Linear Single-Index Models. Journal of Multivariate Analysis, 97, 1162-1184.
https://doi.org/10.1016/j.jmva.2005.11.005

[5] Xia, Y., Tong, H., Li, W.K. and Zhu, L. (2002) An Adaptive Estimation of Dimension Reduction Space. Journal of the Royal Statistical Society, Series B, 64, 363-410.
https://doi.org/10.1111/1467-9868.03411

[6] Liu, J., Zhang, R., Zhao, W. and Lv, Y. (2013) A Robust and Efficient Estimation Method for Single Index Models. Journal of Multivariate Analysis, 122, 226-238.
https://doi.org/10.1016/j.jmva.2013.08.007

[7] Jiang, R., Qian, W.M. and Zhou, Z.G. (2016) Weighted Composite Quantile Regression for Single-Index Models. Journal of Multivariate Analysis, 148, 34-48.
https://doi.org/10.1016/j.jmva.2016.02.015

[8] Wang, J.L., Xue, L.G., Zhu, L.X. and Chong, Y.S. (2010) Estimation for a Par-tial-Linear Single-Index Model. The Annals of Statistics, 1, 246-274.
https://doi.org/10.1214/09-AOS712

[9] Liang, H., Liu, X., Li, R.Z. and Tsai, C.L. (2010) Estimation and Testing for Partially Linear Single-Index Models. The Annals of Statistics, 6, 3811-3836.
https://doi.org/10.1214/10-AOS835

[10] Christou, E. and Akritas, M.G. (2016) Single Index Quantile Regression for Heteroscedastic Data. Journal of Multivariate Analysis, 150, 169-182.
https://doi.org/10.1016/j.jmva.2016.05.010

[11] Zou, H. and Yuan, M. (2008) Composite Quantile Regression and the Oracle Model Selection Theory. Annals of Statistics, 36, 1108-1126.
https://doi.org/10.1214/07-AOS507

[12] Jiang, R., Zhou, Z.G., Qian, W.M. and Shao, W.Q. (2012) Single-Index Composite Quantile Regression. Journal of the Korean Statistical Society, 3, 323-332.
https://doi.org/10.1016/j.jkss.2011.11.001

[13] Zhao, K. and Lian, H. (2016) A Note on the Efficiency of Composite Quantile Regression. Journal of Statistical Computation and Simulation, 86, 1334-1341.
https://doi.org/10.1080/00949655.2015.1062096

[14] Kraus, D. and Czado, C. (2017) D-Vine Copula Based Quantile Regression. Computational Statistics and Data Analysis, 110, 1-18.
https://doi.org/10.1016/j.csda.2016.12.009

[15] Jiang, R., Qian, W.M. and Zhou, Z.G. (2016) Single-Index Composite Quantile Regression with Heteroscedasticity and General Error Distributions. Statistical Papers, 57, 185-203.
https://doi.org/10.1007/s00362-014-0646-y

[16] Tian, Y., Zhu, Q. and Tian, M. (2016) Estimation of Linear Composite Quantile Regression Using EM Algorithm. Statistics and Probability Letters, 117, 183-191.
https://doi.org/10.1016/j.spl.2016.05.019

[17] Wang, Q. and Wu, R. (2013) Shrinkage Estimation of Partially Linear Single-Index Models. Statistics and Probability Letters, 83, 2324-2331.
https://doi.org/10.1016/j.spl.2013.06.019

[18] Wu, T.Z., Yu, K. and Yu, Y. (2010) Single-Index Quantile Regression. Journal of Multivariate Analysis, 101, 1607-1621.
https://doi.org/10.1016/j.jmva.2010.02.003

[19] Rémillard, B., Nasri, B. and Bouezmarni, T. (2017) On Copula-Based Condi-tional Quantile Estimators. Statistics and Probability Letters, 128, 14-20.
https://doi.org/10.1016/j.spl.2017.04.014

[20] Fan, J., Hu, T.C. and Truong, Y.K. (1994) Robust Nonparametric Function Estimation. Scandinavian Journal of Statistics, 21, 433-446.

[21] Pollard, D. (1991) Asymptotics for Least Absolute Deviation Regression Estimators. Econometric Theory, 7, 186-199.
https://doi.org/10.1017/S0266466600004394

分享
Top