<acronym id="owqss"><center id="owqss"></center></acronym>
<acronym id="owqss"></acronym>
<acronym id="owqss"><center id="owqss"></center></acronym>

廣義部分函數型線性模型的多項式樣條估計

彭清艷 羅金梅 周建軍

引用本文:
Citation:

廣義部分函數型線性模型的多項式樣條估計

    作者簡介: 彭清艷(1983?),女,四川人,博士,中級統計師,主要從事函數型數據分析方面的研究. E-mail:214768469@qq.com;
    通訊作者: 周建軍, zhoujj@ynu.edu.cn
  • 中圖分類號: O213.2

Polynomial spline estimation for generalized partial functional linear regression models

    Corresponding author: ZHOU Jian-jun, zhoujj@ynu.edu.cn
  • CLC number: O213.2

  • 摘要: 考慮到樣條估計方法的計算效率和估計結果的光滑性,研究了廣義部分函數型線性模型的多項式樣條估計. 在一定的正則條件下,獲得了參數估計的漸近正態性及斜率函數估計的全局收斂速度. 通過模擬研究,說明了估計方法的有效性,同時發現當真實斜率函數光滑且不能表示成少數特征函數線性組合時,樣條估計優于函數型主成份估計.
  • 表 1  不同模型和樣本量下參數部分估計 $\hat \beta $ 的偏差(標準差)

    Table 1.  The bias (std) of estimators $\hat \beta $ under different models and sample sizes

    模型n=200n=500
    ${{Bia}}{{{s}}_{{s}}}$(${{st}}{{{d}}_{{s}}}$)${{Bia}}{{{s}}_p}$(${{st}}{{{d}}_p}$)${{Bia}}{{{s}}_{{s}}}$(${{st}}{{{d}}_{{s}}}$)${{Bia}}{{{s}}_p}$(${{st}}{{{d}}_p}$)
    模型1${\hat \beta _0}$?0.029(0.070)?0.022(0.071)?0.004(0.046) 0.000(0.046)
    ${\hat \beta _1}$?0.002(0.075)?0.001(0.076) 0.000(0.043) 0.000(0.043)
    ${\hat \beta _2}$ 0.004(0.073) 0.004(0.073) 0.001(0.047) 0.001(0.047)
    ${\hat \beta _3}$ 0.003(0.075) 0.003(0.075) 0.001(0.045) 0.001(0.045)
    模型2${\hat \beta _0}$?0.009(0.072)?0.008(0.073)?0.006(0.045)?0.004(0.046)
    ${\hat \beta _1}$?0.000(0.079)?0.000(0.079)?0.000(0.047)?0.001(0.047)
    ${\hat \beta _2}$ 0.001(0.079) 0.001(0.078) 0.004(0.045) 0.003(0.045)
    ${\hat \beta _3}$ 0.004(0.079) 0.003(0.079) 0.001(0.049) 0.001(0.045)
    模型3${\hat \beta _0}$?0.017(0.074)?0.012(0.074)?0.009(0.043)?0.007(0.043)
    ${\hat \beta _1}$ 0.005(0.086) 0.005(0.085) 0.001(0.052) 0.001(0.052)
    ${\hat \beta _2}$ 0.004(0.113) 0.003(0.113)?0.002(0.063)?0.003(0.063)
    ${\hat \beta _3}$?0.004(0.079)?0.004(0.079) 0.004(0.049) 0.004(0.048)
    下載: 導出CSV

    表 2  不同模型和樣本量下斜率函數估計 $\hat \alpha (t)$ 的MSE的均值(標準差)

    Table 2.  The mean (std) of MSE of estimators $\hat \alpha (t)$ under different models and sample sizes

    模型$n = 200$$n = 500$
    MSEsMSEpMSEsMSEp
    模型10.209(0.245)0.319(0.167)0.086(0.114)0.197(0.095)
    模型21.229(0.737)1.119(0.744)0.506(0.370)0.630(0.262)
    模型32.637(4.596)0.221(0.266)0.960(1.154)0.096(0.130)
    下載: 導出CSV
    鸿禾娱乐
  • [1] 楊春燕, 張瑩. 恒加壽命試驗在定時截尾逐級刪失模型下的優化設計[J]. 云南大學學報: 自然科學版, 2019, 41(6): 1 083-1 089. DOI:  10.7540/j.ynu.20180324. Yang C Y, Zhang Y. Planning constant-stress ALT under type I progressive censoring[J]. Journal of Yunnan University: Natural Sciences Edition, 2019, 41(6): 1 083-1 089.
    [2] 白全紅, 劉勇, 陳菁菁, 等. 基于Logistic模型的烤煙收購質量控制分析[J]. 云南大學學報: 自然科學版, 2014, 36(S1): 1-5. Bai Q H, Liu Y, Chen J J, et al. Quality control analysis of flue-cured tobacco Acquisition based on the Logistic Model[J]. Journal of Yunnan University: Natural Sciences Edition, 2014, 36(S1): 1-5.
    [3] Ramsay J, Silverman B W. Functional data analysis[M]. 2nd ed. New York: Springer, 1997.
    [4] Ferraty F, Vieu, P. Nonparametric functional data analysis[M]. New York: Springer, 2006.
    [5] Hsing T, Eubank R. Theoretical foundations of functional data analysis with an introduction to linear operators[M]. Chichester: Wiley, 2015.
    [6] Cardot H, Ferraty F, Sarda P. Functional linear model[J]. Statistics & Probability Letters, 1999, 45(1): 11-22.
    [7] Cardot H, Ferraty F, Sarda P. Spline estimators for the functional linear model[J]. Statistica Sinica, 2003, 13(3): 571-591.
    [8] Yao F, Müller H G, Wang J L. Functional data analysis for sparse longitudinal data[J]. Journal of the American Statistical Association, 2005, 100(470): 577-590.
    [9] Ferraty F, Vieu P. The functional nonparametric model and application to spectrometric data[J]. Computational Statistics, 2002, 17(4): 545-564.
    [10] Burba F, Ferraty F, Vieu P. k-Nearest neighbour method in functional nonparametric regression[J]. Journal of Nonparametric Statistics, 2009, 21(4): 453-469.
    [11] Aneiros-Pérez G, Vieu P. Semi-functional partial linear regression[J]. Statistics & Probability Letters, 2006, 76(11): 1 102-1 110.
    [12] Shin H. Partial functional linear regression[J]. Journal of Statistical Planning and Inference, 2009, 139(10): 3 405-3 418.
    [13] Zhou J, Chen M. Spline estimators for semi-functional linear model[J]. Statistics & Probability Letters, 2012, 82(3): 505-513.
    [14] 余平, 杜江, 張忠占. 部分函數型線性可加分位數回歸模型[J]. 系統科學與數學, 2017, 37(5): 1 335-1 350. Yu P, Du J, Zhang Z Z. Partial functional linear additive quantile regression model[J]. Journal of Systems Science and Complexity, 2017, 37(5): 1 335-1 350.
    [15] Nelder J A, Wedderburn R W M. Generalized linear models[J]. Journal of the Royal Statistical Society Series B, 1972, 135(3): 370-384.
    [16] Mccullagh P, Nelder J A. Generalized linear models[M]. 2nd ed. London: Chapman and Hall, 1989.
    [17] Müller H, Stadtmüller U. Generalized functional linear models[J]. Annals of Statistics, 2005, 33(2): 774-805.
    [18] Cardot H, Sarda P. Estimation in generalized linear model for functional data via penalized likelihood[J]. Journal of Multivariate Analysis, 2005, 92(1): 24-41.
    [19] 王惠文, 黃樂樂, 王思洋. 基于函數型數據的廣義線性回歸模型[J]. 北京航空航天大學學報, 2016, 42(1): 8-12. Wang H W, Huang L L, Wang S Y. Generalized linear regression model based on functional data analysis[J]. Journal of Beijing University of Aeronautics and Astronautics, 2016, 42(1): 8-12.
    [20] Cao R, Du J, Zhou J, Xie T. FPCA-based estimation for generalized functional partially linear models[J]. Statistical Papers, 2019. DOI:  10.1007/s00362-018-01066-8.
    [21] Zhou J, Chen Z, Peng Q. Polynomial spline estimation for partial functional linear regression models[J]. Computational Statistics, 2016, 31(3): 1 107-1 129.
    [22] Cai X, Xue L, Lu F. Robust estimation with a modified huber’s loss for partial functional linear models based on splines[J]. Journal of The Korean Statistical Society, 2020. DOI:  10.1007/S42952-020-00052-X.
    [23] Thomas A S, Joan G S. Qusi-likelihood estimation in semiparametric models[J]. Journal of the American Statistical Association, 1994, 89(426): 501-511.
    [24] de Door C. A practical guide to splines[M]. New York: Springer, 2001.
    [25] Lian H. Functional partial linear model[J]. Nonparametric statistics, 2011, 23(1): 115-128.
    [26] Ramsay J, Hooker G, Graves S. Functional data analysis with R and Matlab[M]. New York: Springer, 2009.
    [27] Huang J Z, Shen H. Functional coefficient regression models for non-linear time series: a polynomial spline approach[J]. Scandinavian Journal of Statistics, 2004, 31(4): 515-534.
    [28] Rice J A, Silverman B W. Estimating the mean and covariance structure nonparametrically when the data are curves[J]. Journal of the Royal Statistical Society Series B, 1991, 53(1): 233-243.
    [29] Cai Z, Fan J, Yao Q. Functional-coefficient regression model for nonlinear time series[J]. Journal of American Statistical Association, 2000, 95(451): 941-956.
    [30] Wang L, Liu X, Liang H, Carroll R J. Estimation and Variable selection for generalized addtive partial linear models[J]. The Annals of Statisties, 2011, 39(4): 1 827-1 851.
    [31] DeVore R A, Lorentz G G. Constructive approximation[M]. Berlin: Springer-Verlag, 1993.
  • [1] 聞道君宋樹枝萬波 . 雙曲空間中幾乎漸近非擴張型映象不動點的收斂性定理. 云南大學學報(自然科學版), doi: 10.7540/j.ynu.20160282
    [2] 傅可昂 . 正相伴序列的矩完全收斂性. 云南大學學報(自然科學版),
    [3] 陳大學周樹清夏學文龍玉花 . 偶數階非線性中立型阻尼微分方程的振動性與漸近性. 云南大學學報(自然科學版),
    [4] 何昌徐裕光孫昭洪 . 漸近非擴張映象的修正Reich-Takahashi迭代收斂性. 云南大學學報(自然科學版),
    [5] 丁體明 . 非線性隱變分包含問題解的存在性和收斂性定理. 云南大學學報(自然科學版),
    [6] 胡雪梅王志忠 . 帶有不完全橢球約束的多元線性模型中線性估計的可容許性. 云南大學學報(自然科學版),
    [7] 王文強李壽佛黃山 . 非線性隨機延遲微分方程半隱式Euler方法的收斂性. 云南大學學報(自然科學版),
    [8] 許興業 . 一類Rn上奇異非線性雙調和方程正整解的存在性及性質. 云南大學學報(自然科學版),
    [9] 劉哲黃曉紅潘江敏 . 剩余類環上的置換多項式. 云南大學學報(自然科學版),
    [10] 陳小松 . 一類分圓多項式的系數. 云南大學學報(自然科學版),
    [11] 鞏增泰張璐 . 模糊數值函數的統計收斂,一致統計收斂及等度統計收斂. 云南大學學報(自然科學版),
    [12] 馮雪鞏增泰 . 基于Orlicz函數的模糊數列AI-統計收斂和強AI-收斂. 云南大學學報(自然科學版), doi: 10.7540/j.ynu.20190167
    [13] 趙海軍賀春林王朝斌蒲斌陳毅紅崔夢天 . 基于多項式時間近似及其改進算法的WSN設計. 云南大學學報(自然科學版), doi: 10.7540/j.ynu.20190595
    [14] 李彥敏陳向煒 . 二階廣義自治Birkhoff系統的全局穩定性. 云南大學學報(自然科學版), doi: 10.7540/j.ynu.20120690
    [15] 傅竹武劉建華胥頤文麗敏續外芬馬紅虎 . 利用接收函數方法研究大盈江斷裂兩側S波速度結構. 云南大學學報(自然科學版),
    [16] 劉詩煥朱先陽 . 阻尼Boussinesq方程初邊值問題解的漸近性. 云南大學學報(自然科學版),
    [17] 李紅玉熊道統崔玉軍 . 一類奇異非線性m點邊值問題的解的全局結構. 云南大學學報(自然科學版),
    [18] 石磊李興緒陳飛王剛陳宏 . 生產函數模型中參數的Minimax估計及應用. 云南大學學報(自然科學版),
    [19] 鄭緒枝夏薇雷靖 . 一種改進的Jacobi正交多項式的BP神經網絡算法. 云南大學學報(自然科學版),
    [20] 王志忠劉琴 . 帶約束的增長曲線模型中的可容許線性估計. 云南大學學報(自然科學版),
  • 加載中
表(2)
計量
  • 文章訪問數:  107
  • HTML全文瀏覽量:  99
  • PDF下載量:  5
  • 被引次數: 0
出版歷程
  • 收稿日期:  2020-07-24
  • 錄用日期:  2020-09-23
  • 網絡出版日期:  2020-09-24

廣義部分函數型線性模型的多項式樣條估計

    作者簡介:彭清艷(1983?),女,四川人,博士,中級統計師,主要從事函數型數據分析方面的研究. E-mail:214768469@qq.com
    通訊作者: 周建軍, zhoujj@ynu.edu.cn
  • 1. 昆明醫科大學 第一附屬醫院 國家衛健委毒品依賴和戒治重點實驗室,云南 昆明 650032
  • 2. 昆明醫科大學 第一附屬醫院 質量管理科,云南 昆明 650032
  • 3. 云南大學 云南省統計建模與數據分析重點實驗室,云南 昆明 650091

摘要: 考慮到樣條估計方法的計算效率和估計結果的光滑性,研究了廣義部分函數型線性模型的多項式樣條估計. 在一定的正則條件下,獲得了參數估計的漸近正態性及斜率函數估計的全局收斂速度. 通過模擬研究,說明了估計方法的有效性,同時發現當真實斜率函數光滑且不能表示成少數特征函數線性組合時,樣條估計優于函數型主成份估計.

English Abstract

  • 傳統的統計建模與數據分析處理的對象通常為向量型數據[1-2]. 然而,隨著測量設備和計算工具的進步,在眾多應用領域,如生物計量學、醫學、計量經濟學等,許多數據可以被連續觀測. 區別于傳統的向量型數據,由于該類型數據具有某種連續性特征,因此被稱之為函數型數據. 針對函數型數據,開發區別于傳統的統計分析方法引起了廣泛的關注. 如Ramsay等[3]將傳統的統計分析方法推廣到函數型數據下,提出了函數型主成份分析、函數型典型相關分析、函數型線性回歸模型等;Ferraty等[4]將非參數方法引入到函數型數據分析中,提出了基于核方法的非參數函數型回歸模型. 更多關于函數型數據分析的著作可參見文獻[5].

    在函數型數據分析中,函數型回歸模型是一個重要的研究內容. 針對函數型線性回歸模型,Cardot等[6]提出了基于函數型主成份的估計方法,并研究了估計的相合性. 隨后,Cardot等[7]進一步研究了模型的懲罰樣條估計并得到了估計的全局收斂速度.Yao等[8]考慮了在稀疏離散觀測下函數型線性回歸模型的估計問題及理論性質. 對于非參數函數型回歸問題,Ferraty等[9]研究了模型的核估計問題;Burba等[10]考慮了K近鄰估計,得到了估計的幾乎完全收斂速度. 與此同時,為了提高模型的預測能力和可解釋性,額外的向量型解釋變量被引入到函數型回歸模型中,如Aneiros-Pérez等[11]在非參數函數型回歸模型中引入傳統的線性回歸從而提出了半函數部分線性模型;Shin[12] 研究了函數型部分線性模型的函數型主成份估計,并得到了參數部分估計的漸進正態性和函數系數估計的全局收斂速度;Zhou等[13]提出了半函數線性模型和樣條估計方法,并在一定條件下得到了估計的全局收斂速度. 余平等[14]提出了部分函數型線性可加分位數回歸模型.

    以上研究都基于響應變量為連續變量且關于解釋變量的條件期望為線性函數這一假定,然而在很多情況下響應變量或為離散取值(如響應變量為是否違約)或條件期望為非線性函數(如響應變量服從指數分布). 針對此種情況,傳統的線性回歸模型不再有效,為此Nelderhe等[15]提出了廣義線性模型. 由于廣義線性模型可以靈活的對離散或連續性響應變量進行回歸建模,因而被廣泛研究,關于廣義線性模型的詳細介紹可參考文獻[16].

    在函數型數據情況下,Müller等[17] 提出了廣義函數型線性回歸模型,并在連接函數已知和未知情況下研究了基于函數型主成份分析的估計方法及理論性質;同時,Cardot等[18] 研究了該模型基于樣條的懲罰似然估計及收斂速度. 最近,王惠文等[19]提出了基于函數型數據的廣義線性回歸模型和估計方法,但沒討論估計的理論性質;Cao等[20]針對廣義部分函數型線性模型提出了函數型主成份估計方法,并獲得了參數部分估計的漸近正態性和斜率函數的全局收斂速度. 相比于函數型主成份估計,由于其計算的有效性和估計的光滑易解釋性,多項式樣條估計也被常用于函數型回歸建模[21-22]. 因此,本文主要研究廣義函數型線性回歸模型的多項式樣條估計,并在一定的正則條件下推導估計的理論性質,獲得參數部分估計的漸近正態性和斜率函數估計的全局收斂速度. 最后,通過數值模擬研究估計的有限樣本性質.

    • 本節首先介紹廣義部分函數型線性模型. 假設 $Y$ 為連續或離散的實值響應變量,實值解釋變量 $Z = {({Z_1}, \cdots ,{Z_p})^{\rm{T}}}$,$X$ 為一個均值為零,取值于一個平方可積函數的希爾伯特空間 ${{H}}$ 的隨機函數. 令 $< {\varphi _1},{\varphi _2} > = \displaystyle\int_0^1 {{\varphi _1}(s){\varphi _2}} (s){\rm{d}}s$ 為函數 ${\varphi _1}$${\varphi _2}$ 的內積,$||\varphi || = < \varphi ,\varphi { > ^{\frac{1}{2}}}$ 定義了空間 ${{H}}$ 的范數. 設給定 $(X,Z) = (x,z)$ 時,響應變量 $Y$ 的條件分布服從指數族分布,其概率密度函數為:

      $\qquad f(y|x,z) = \exp \{ y\eta (x,z) - b[(x,z)] + c(y)\} ,$

      其中 ${}$${{c}}$ 是已知函數,$\eta $ 為指數族分布的自然參數. 則 $Y$ 的條件均值為:

      $\qquad \mu (x,z) = E(Y|X = x,Z = z) = {b^{'}}(\eta (x,z)).$

      假定在已知的連接函數 ${{g}}$ 下,上述的條件均值滿足:

      $\qquad g\{ \mu (x,z)\} = \int_0^1 {x(t)\alpha (t){\rm{d}}t + {z^{\rm{T}}}} \beta ,$

      其中 $\beta $ 為未知的 $p$ 維參數向量,$\alpha (t)$ 是未知的斜率函數. 如果連接函數 $g(\mu ) = \mu $,則模型(3)就為文獻[12]所研究的部分函數型線性模型.

      接下來討論模型的估計問題. 根據文獻[23]可知,如果對已知的正函數 $V$,$Y$ 的條件方差函數可以表示為 ${\rm{var} }(Y|X = x,Z = z) = {\sigma ^2}V\{ \mu (x,z)\} $,則對模型(3)中均值的估計可以通過極大化擬似然函數 $Q(\mu ,y)$ 得到,其中擬似然函數滿足如下條件:

      $\qquad \frac{{\partial Q(\mu ,y)}}{{\partial \mu }} = \frac{{y - \mu }}{{V(\mu )}}.$

      由于模型(3)中包含了無窮維參數 $\alpha (t)$,直接極大化擬似然函數 $Q(\mu ,y)$ 無法得到其估計,因此需要將其降維處理. 本文采用多項式樣條方法來對斜率函數 $\alpha (t)$ 進行降維估計,從而提出了基于擬似然的多項式樣條估計方法.

      在介紹多項式樣條估計之前,首先簡單介紹一下樣條函數和樣條函數空間. 令 $r$ 為正整數,稱區間 $[0,1]$ 上的一個劃分 $0 = {t_0} < {t_1} < \cdots < {t_J} < {t_{J + 1}} = 1$ 為結點序列. 如果一個函數 $h$ 在每個子區間 $[{t_{l - 1}},{t_l}]$,$l = 1, \cdots ,J + 1$ 上為 $r$ 次多項式,且在整個區間 $[0,1]$ 上具有 $r{\rm{ - }}1$ 階連續導函數,則稱函數 $h$$r$ 次樣條函數. 為了便于理論推導和模擬研究,本文假定結點序列被均勻放置在區間 $[0,1]$ 上. 令 ${S_{r,J}}$ 表示由上述定義在區間 $[0,1]$ 上,且具有結點序列 $\{ t{}_0,{t_1}, \cdots ,{t_J},{t_{J + 1}}\} $$r$ 次樣條函數組成的樣條空間,則可知該樣條空間為一個線性空間,其維數為 ${N_n} = J + r + 1$. 關于更多樣條的相關知識可見文獻[24].

      為了避免混淆,本文用 ${\alpha _0}$${\beta _0}$ 分別表示真實的斜率函數和回歸參數. 根據文獻[24]中的定理XII.1可知,如果斜率函數 ${\alpha _0}$ 充分光滑,則在樣條空間 ${S_{r,J}}$ 中存在一個樣條函數 $a(t)$ 使得:

      $\qquad {\alpha _0}(t) \approx a(t) = \sum\limits_{k = 1}^{{N_n}} {{b_k}} {\phi _k}(t),$

      其中 ${\phi _k}(t)$ 為樣條空間中的一組基函數,本文選擇B樣條函數作為基函數. 由此,模型(3)式可近似表示為:

      $\qquad g\{ \mu (x,z)\} \approx \int_0^1 {x(t)a(t){\rm{d}}t + {z^{\rm{T}}}} \beta = \sum\limits_{k = 1}^{{N_n}} {{b_k}} < x,{\phi _k} > + {z^{\rm{T}}}\beta .$

      $\{ ({X_i},{Z_i},{Y_i})\} _{i = 1}^n$ 為來自聯合分布 $(X,Z,Y)$ 的一個獨立同分布樣本,其近似的擬似然函數為:

      $\qquad L(b,\beta ) = \frac{1}{n}\sum\limits_{i = 1}^n {Q\{ {g^{ - 1}}(B_i^{\rm{T}}b + } Z_i^{\rm{T}}\beta ),{Y_i}\} ,$

      其中 ${B_i} = {( < {X_i},{\varphi _1} > , \cdots , < {X_i},{\varphi _{{N_n}}} > )^{\rm{T}}},b = {({b_1}, \cdots ,{b_{{N_n}}})^{\rm{T}}}$. 極大化擬似然函數(6)得到參數 $b$$\beta $ 的估計 $\hat b = {({\hat b_1}, \cdots ,{\hat b_{{N_n}}})^{\rm{T}}}$,$\hat \beta = {({\hat \beta _1}, \cdots ,{\hat \beta _p})^{\rm{T}}}$,從而斜率函數 $\alpha (t)$ 的多項式樣條估計為:

      $\qquad \alpha (t) = \sum\limits_{k = 1}^{{N_n}} {{{\hat b}_k}} {\phi _k}(t).$

    • 本節主要通過數值模擬研究多項式樣條估計的有限樣本行為. 設響應變量 $Y$ 為指數分布,其連接函數 $g$ 為對數函數 ${\rm{ln}}$. 樣本 $\{ ({X_i},{Z_i},{Y_i})\} _{i = 1}^n$ 來自于如下3種模型.

      模型1:

      $\qquad {\rm{ln}}({\mu _i}) = 0.5 - 2{Z_{i1}} + {Z_{i2}} - 1.7{Z_{i3}} + \int_0^1 {{X_i}} (t)\alpha (t){\rm{d}}t,$

      其中 ${Z_i} = {({Z_{i1}},{Z_{i2}},{Z_{i3}})^{\rm{T}}}$ 來自于多元正態分布 $N(0,{I_3})$. 類似于文獻[25],隨機函數 ${X_i}(t) = \displaystyle\sum\limits_{j = 1}^{50} {{\xi _{ij}}{j^{ - 1}}{\varphi _j}(t)} $,其中 ${\varphi _1}(t) = 1$時,${\varphi _j}(t) = \sqrt 2 \cos ((j - 1){\text{π}}t)$,${\xi _{ij}}$ 為來自 $U[ - \sqrt 3 ,\sqrt 3 ]$ 的獨立同分布序列. 斜率函數 $\alpha (t) = \displaystyle\sum\limits_{j = 1}^{50} {{b_j}\varphi {}_j(t)} $,其中 ${b_1} = 0.5$,${b_j} = 4{j^{ - 2}}$,$j \geqslant 2$.

      模型2:

      $\qquad \ln ({\mu _i}) = 1 + 5{Z_{i1}} - 1.5{Z_{i2}} + 1.7{Z_{i3}} + \int_0^1 {{X_i}} (t)\alpha (t){\rm{d}}t,$

      其中 ${Z_i} = {({Z_{i1}},{Z_{i2}},{Z_{i3}})^{\rm{T}}}$ 來自于多元正態分布 $N(0,{I_3})$. 隨機函數 ${X_i}(t)$ 與模型1相同. 斜率函數為:

      $\qquad \alpha (t) = 2\sin (0.5{\text{π}}t) + 4\sin (1.5{\text{π}}t) + 5\sin (2.5{\text{π}}t).$

      模型3:

      $\qquad \ln ({\mu _i}) = - 0.5 + 1.5{Z_{i1}} - {Z_{i2}} + 2{Z_{i3}} + \int_0^1 {{X_i}} (t)\alpha (t){\rm{d}}t,$

      其中 ${Z_i} = {({Z_{i1}},{Z_{i2}},{Z_{i3}})^{\rm{T}}}$ 來自于多元正態分布 $N(0,\Phi )$,其中 $\Phi = [0.9,0.2,0.3;0.2,0.5,0.1;0.3,0.1,1]$.隨機函數 ${X_i}(t)$ 為標準的布朗運動. 斜率函數為:

      $\qquad \alpha (t) = \sqrt 2 \sin (0.5{\text{π}}t) + 3\sqrt 2 \sin (1.5{\text{π}}t).$

      模型1中的斜率函數 $\alpha (t)$ 為隨機函數 ${X_i}(t)$ 協方差算子的多個特征函數線性組合,模型2中的斜率函數 $\alpha (t)$ 不能表示成多個特征函數的線性組合,模型3的斜率函數 $\alpha (t)$ 為隨機函數 ${X_i}(t)$ 協方差算子的前2個特征函數的線性組合. 通過以上3種不同斜率函數的設定來說明多項式樣條方法和函數型主成份方法之間的差別. 在實際中,由于不能觀測到整條曲線,因此在模型1~3中,隨機函數 ${X_i}(t)$ 為在區間 $[0,1]$ 上平均分配的101個點的取值.

      為了運行函數型主成份分析方法,需要把 ${X_i}(t)$ 的離散觀測值轉變成函數型數據. 為此,利用文獻[26]第4章所涉及的方法,選擇30個B樣條函數來建立函數型數據,同時運用其第7章中的pca_fd函數來執行函數型主成分分析. 此外,為了運行多項式樣條估計,需要選擇樣條的次數、結點的位置和個數. 類似于文獻[27],本文選擇在區間 $[0,1]$ 上均勻分配結點的3次B樣條函數. 這時只需要選擇特征函數和B-樣條函數的個數 ${N_n}$. 許多方法可以用來選擇 ${N_n}$,如AIC、BIC、刪一交叉驗證[28]和修正的多步交叉驗證[29]等. 本文選用BIC方法來選擇B樣條函數及特征函數的個數 ${N_n}$. 在程序中B樣條函數個數的選擇范圍為4-13,特征函數個數的選擇范圍為1-10. 估計中所有涉及到的積分都用黎曼和來近似代替. 同時選擇Matlab軟件中的glmfit函數進行參數估計.

      為了比較斜率函數 $\alpha (t)$ 的多項式樣條方法和函數型主成份方法的估計效果,定義其估計的均方誤差(MSE)如下:

      $\qquad {\rm{MSE}} = {N^{ - {\rm{1}}}}\sum\limits_{l = 1}^N {{{[\hat \alpha ({t_l}) - \alpha ({t_l})]}^2}}, $

      其中 $\{ {t_l},l = 1, \cdots ,N\} $ 為區間 $[0,1]$ 上均勻選擇的格子點,本文取 $N = 101$.

      針對上述3個模型,考慮了2個不同的樣本量 $n = 200$$n = 500$,對每個模擬試驗重復運行了500次. 模擬結果見表12,其中下標sp分別代表多項式樣條估計和基于函數型主成份方法的估計結果. 表1概括了不同模型和樣本量下,基于多項式樣條和函數型主成份方法參數估計的偏差和標準差. 表2給出了3個模型下斜率函數 $\alpha (t)$ 在2種不同估計方法下的MSE. 從表中的結果可以發現,隨著樣本量的增大,參數估計的偏差和標準差以及斜率函數 $\alpha (t)$ 估計的MSE都變小,說明2種估計方法都有效. 同時,對于參數部分來說,多項式樣條方法和函數型主成份方法的估計效果基本差不多. 但是對于斜率函數 $\alpha (t)$ 來說,在平均意義下,模型1下多項式樣條方法比函數型主成分方法估計效果要好,而模型3下函數型主成份方法要比多項式樣條方法估計的更精確,這表明當真實的斜率函數不能被少數幾個特征函數所表示時,多項式樣條估計效果更好;而當其能表示為少數幾個特征函數的線性組合時,函數型主成份方法的估計效果更好.

      模型n=200n=500
      ${{Bia}}{{{s}}_{{s}}}$(${{st}}{{{d}}_{{s}}}$)${{Bia}}{{{s}}_p}$(${{st}}{{{d}}_p}$)${{Bia}}{{{s}}_{{s}}}$(${{st}}{{{d}}_{{s}}}$)${{Bia}}{{{s}}_p}$(${{st}}{{{d}}_p}$)
      模型1${\hat \beta _0}$?0.029(0.070)?0.022(0.071)?0.004(0.046) 0.000(0.046)
      ${\hat \beta _1}$?0.002(0.075)?0.001(0.076) 0.000(0.043) 0.000(0.043)
      ${\hat \beta _2}$ 0.004(0.073) 0.004(0.073) 0.001(0.047) 0.001(0.047)
      ${\hat \beta _3}$ 0.003(0.075) 0.003(0.075) 0.001(0.045) 0.001(0.045)
      模型2${\hat \beta _0}$?0.009(0.072)?0.008(0.073)?0.006(0.045)?0.004(0.046)
      ${\hat \beta _1}$?0.000(0.079)?0.000(0.079)?0.000(0.047)?0.001(0.047)
      ${\hat \beta _2}$ 0.001(0.079) 0.001(0.078) 0.004(0.045) 0.003(0.045)
      ${\hat \beta _3}$ 0.004(0.079) 0.003(0.079) 0.001(0.049) 0.001(0.045)
      模型3${\hat \beta _0}$?0.017(0.074)?0.012(0.074)?0.009(0.043)?0.007(0.043)
      ${\hat \beta _1}$ 0.005(0.086) 0.005(0.085) 0.001(0.052) 0.001(0.052)
      ${\hat \beta _2}$ 0.004(0.113) 0.003(0.113)?0.002(0.063)?0.003(0.063)
      ${\hat \beta _3}$?0.004(0.079)?0.004(0.079) 0.004(0.049) 0.004(0.048)

      表 1  不同模型和樣本量下參數部分估計 $\hat \beta $ 的偏差(標準差)

      Table 1.  The bias (std) of estimators $\hat \beta $ under different models and sample sizes

      模型$n = 200$$n = 500$
      MSEsMSEpMSEsMSEp
      模型10.209(0.245)0.319(0.167)0.086(0.114)0.197(0.095)
      模型21.229(0.737)1.119(0.744)0.506(0.370)0.630(0.262)
      模型32.637(4.596)0.221(0.266)0.960(1.154)0.096(0.130)

      表 2  不同模型和樣本量下斜率函數估計 $\hat \alpha (t)$ 的MSE的均值(標準差)

      Table 2.  The mean (std) of MSE of estimators $\hat \alpha (t)$ under different models and sample sizes

    • 本節討論參數部分 $\beta $ 和斜率函數 $\alpha (t)$ 的多項式樣條估計的理論性質. 為了便于研究估計的漸近性質,需要如下的定義和符號. 令 $H(q)$ 為一個定義在區間 $[0,1]$ 上的函數族,其中 $q = v + \tau > 2$,對于每一個函數 $f \in H(q)$ 滿足如下條件:

      (i)函數 $f$ 在區間 $[0,1]$$v$ 階可導;

      (ii)對于任意的0≤${t^*},t$≤1,存在常數 $C > 0$ 使得 $|{f^{(v)}}({t^*}) - {f^{(v)}}(t)|$${{C|}}{{{t}}^*} - {{t}}{{{|}}^\tau }$.

      類似于文獻[6],令 $\Gamma $ 表示隨機函數 $X$ 的協方差算子,即

      $\qquad \Gamma x(t) = \int_0^1 {EX(t)X(s)x(s){\rm{d}}s,x \in H} .$

      類似于文獻[27],定義

      $\qquad {\rho _l}({\rm{m}}) = {\left[ {\frac{{{\rm{d}}{g^{ - 1}}(m)}}{{{\rm{d}}m}}} \right]^l}\frac{1}{{V\{ {g^{ - 1}}(m)\} }},\;{q_l}({{m}},y) = \frac{{{\partial ^l}Q\{ {g^{ - 1}}(m),y\} }}{{\partial {m^l}}}. $

      因此 ${q_1}({{m}},y) = \{ y - {g^{ - 1}}(m)\} {\rho _1}(m)$,${q_2}({{m}},y) = \{ y - {g^{ - 1}}(m)\} \rho _1^{'}(m) - {\rho _2}(m)$. 記 $A = (X,Z)$,${m_0}(A) = < X,{\alpha _0} > + {Z^{{{\rm{T}}}}}{\beta _0}$,$S(X) = \dfrac{{E\{ Z{\rho _2}[{m_0}(A)]|X\} }}{{E\{ {\rho _2}[{m_0}(A)]|X\} }}$. 對于任意的矩陣或向量W,記 ${{{W}}^{ \otimes 2}} = {{W}}{W^{{{\rm{T}}}}}$.$C,c$ 為一般的常數,可根據需要取不同的值. 為了得到斜率函數 $\alpha (t)$ 多項式樣條估計及參數估計 $\hat \beta $ 的理論性質,需要如下正則條件:

      (A1)函數型隨機變量 ${{||}}X|| \leqslant C < \infty $,a.s.,其中a.s. 表示幾乎處處收斂.

      (A2)隨機函數 $X$ 的協方差算子 $\Gamma $ 的所有特征值均為正數,且存在常數 $C > 0$ 使得對于任意的 $f \in {S_{r,J}}$$\left\langle {\Gamma f,f} \right\rangle \geqslant C||f|{|^2}$.

      (A3)真實的斜率函數 ${\alpha _{0}}(t)$ 滿足 ${\alpha _{0}}(t) \in {{H}}(q)$.

      (A4)對于 ${\;\rho _l}({{m}})(l = 1,2)$${{|}}{\rho _l}({{m}}){{|}} < C$,且對于所有的 ${{||}}m - {m_0}|| \leqslant C < \infty $

      $ \qquad |{\rho _l}({{m}}) - {\rho _l}({{{m}}_0})| \leqslant C|{{m}} - {{{m}}_0}|. $

      (A5)對于任意的單位向量 $u \in {{\bf{R}}^p}$,協變量 $Z$ 滿足:$c$${u^{\rm{T}}}E({Z^{ \otimes 2}}|X = x)u$$C$,$c,C > 0$.

      (A6)$ {n^{\frac{1}{{2q}}}} < < {N_n} < < {n^{\frac{1}{2}}}$

      (A7)函數 ${q_1}$${q_2}$ 滿足如下條件:${{|}}{q_1}(m,y) - {q_1}({m_0},y)| < C|m - {m_0}|$,且對于任意的 $m$$y$ 都有 $c$${{|}}q_2^{(v)}({\rm{m}},y)|$$C$,其中 ${{v}} = 0,1$,$c,C > 0$.

      (A8)存在常數 $C > 0$ 使得 $E\{ {[Y - {g^{ - 1}}({m_0}(A))]^2}|A\} $$C$,a.s..

      (A9)對于 $j = 1, \cdots ,p$,${S_j}(X) = \dfrac{{E\{ {Z_j}{\rho _2}[{m_0}(A)]|X\} }}{{E\{ {\rho _2}[{m_0}(A)]|X\} }}$ 為連續線性泛函,即

         ${S_j}(X) = < X,{\alpha _j} > $,且 ${\alpha _j} \in {{H}}(q)$.

      在以上條件下可得如下定理1和2.

      定理 1 當假設條件(A1)-(A8)成立時有:

      $\qquad ||\hat \alpha (t) - {\alpha _0}(t)|| = {O_p}\left(N_n^{\frac{1}{2} - q} + N_n^{\frac{1}{2}}{n^{ - \frac{1}{2}}}\right).$

      定理 2 如果正則條件(A1)-(A9)成立,則有:

      $\qquad \sqrt n (\hat \beta - {\beta _0})\xrightarrow{D}N(0,{\Omega ^{ - 1}}),$

      其中 $\Omega = {{E}}\{ {\rho _2}[{{{m}}_0}(A)]{\bar Z^{ \otimes 2}}\} $,$\bar Z = Z - S(X)$.

      $\hat \theta = {({\hat b^{\rm{T}}},{\hat \beta ^{\rm{T}}})^{\rm{T}}}$,${{{D}}_{{i}}} = {(B_i^{\rm{T}},Z_i^{\rm{T}})^{\rm{T}}}$,${U_n} = \dfrac{{\displaystyle\sum\limits_{i = 1}^n {D_i^{\rm{T}}{D_i}} }}{n}$. 定義 ${\phi _k} = N_n^{\frac{1}{2}}N_k^b$,其中 $N_k^b$ 表示標準化的B樣條函數. 為了證明定理1和2,需要如下3個引理.

      引理 1 如果條件(A1)-(A8)成立,則對于隨機矩陣 ${U_n}$,存在常數 $C > 0$,使得 ${\left\| {U_n^{ - 1}} \right\|_2} < C,\;$ a.s.,其中 $|| \cdot |{|_2}$ 代表矩陣的范數.

      證明 引理 1與文獻[30]中的引理3類似,下面給出簡要證明過程. 由 ${{\rm{U}}_n}$ 的定義可知

      $\qquad {U_n} = \left[ {\begin{array}{*{20}{c}} {\dfrac{{\displaystyle\sum\limits_{{i} = 1}^n {{B_i}B_i^{\rm{T}}} }}{n}}&{\dfrac{{\displaystyle\sum\limits_{{i} = 1}^n {{B_i}Z_i^{\rm{T}}} }}{n}} \\ {\dfrac{{\displaystyle\sum\limits_{{i} = 1}^n {{Z_i}B_i^{\rm{T}}} }}{n}}&{\dfrac{{\displaystyle\sum\limits_{{i} = 1}^n {{Z_i}Z_i^{\rm{T}}} }}{n}} \end{array}} \right].$

      $u = {(u_1^{\rm{T}},u_2^{\rm{T}})^{\rm{T}}}$${N_n} + p$ 維單位向量,其中 ${u_1} = {({u_{11}}, \cdots ,{u_{1{N_n}}})^{\rm{T}}}$,${u_2} = {({u_{21}}, \cdots ,{u_{2p}})^{\rm{T}}}$,則有

      $\qquad {u^{\rm{T}}}{U_n}u = {n^{ - 1}}u_1^{\rm{T}}\sum\limits_{i = 1}^n {B_i^{ \otimes 2}{u_1}} + {n^{ - 1}}u_2^{\rm{T}}\sum\limits_{i = 1}^n {Z_i^{ \otimes 2}{u_2}} + 2{n^{ - 1}}u_1^{\rm{T}}\sum\limits_{i = 1}^n {{B_i}Z_i^{\rm{T}}{u_2}} = {S_1} + {S_2} + 2{S_3}.$

      對于 ${S_1}$${S_1} = {{E}}{\left\langle {X,f} \right\rangle ^2} + \left\langle {({\Gamma _n} - \Gamma )f,f} \right\rangle $,其中 ${\Gamma _n}$ 為協方差算子 $\Gamma $ 的經驗形式. 由條件(A1)、(A2)及文獻[31]的定理4.2可知 $c||{u_1}||_2^2$$E{\left\langle {X,f} \right\rangle ^2}$$C||{u_1}||_2^2$,其中 $|| \cdot |{|_2}$ 代表向量的歐式范數. 又由文獻[4]的定理3.2可知 ${{|}}\left\langle {({\Gamma _n} - \Gamma )f,f} \right\rangle {{|}}$${{o}}(||{u_1}||_2^2)$ a.s.,所以 $c||{u_1}||_2^2$${S_1}$$C||{u_1}||_2^2$,a.s..

      對于 ${S_2}$,由條件(A5)及大數定理可得 $c||{u_2}||_2^2$${S_2}$$C||{u_2}||_2^2$ a.s.,因此 ${S_3} = {{o}}(||{u_1}|{|_2}||{u_2}|{|_2})$ a.s..

      綜合可知 $c||u||_2^2$${u^{{T}}}{U_n}u$$C||u||_2^2$ a.s.. 令 ${\lambda _{{{{\rm{max}}}}}}\left( {{U_n}} \right)$${\lambda _{{{{\rm{min}}}}}}\left( {{U_n}} \right)$ 分別為矩陣 ${U_n}$ 的最大和最小特征值,則有 ${\left\| {{U_n}} \right\|_2} = {\lambda _{\max }}({U_n})$$C$,${\left\| {U_n^{ - 1}} \right\|_2} = \lambda _{{{{\rm{min}}}}}^{ - 1}({U_n})$${c^{ - 1}}$ a.s.. 證畢.

      由文獻[20]可知當 ${\alpha _{0}}(t) \in {{H}}(q)$ 時,在樣條空間 ${S_{r,J}}$ 中存在樣條函數 $\tilde \alpha (t) = {{{\tilde b}}^{\rm{T}}}\phi (t)$,其中 $\phi (t) = {({\phi _1}(t), \cdots ,{\phi _{{N_n}}}(t))^{\rm{T}}}$,${{\tilde b}} = {({\tilde b_1}, \cdots ,{\tilde b_{{N_n}}})^{\rm{T}}}$,使得 $|\tilde \alpha (t) - {\alpha _0}(t){|_\infty }$$CN_n^{ - q}$. 令

        ${\rm{l\tilde n}}(\beta ) = {n^{ - 1}}\displaystyle\sum\limits_{i = 1}^n {Q\{ {g^{ - 1}}( < {X_i},\tilde \alpha > + Z_i^{\rm{T}}\beta ),{Y_i}\} }$,$\tilde \beta = {\rm{arg}}\;\mathop {{\rm{max}}}\limits_{\beta \in {{{{\bf{R}}}}^p}} \left( {{\rm{l\tilde n}}\left( \beta \right)} \right)$.

      則有如下引理2.

      引理 2 在條件(A1)-(A8)下有 $||\tilde \beta - \beta |{|_2} = {O_p}\left({n^{ - \frac{1}{2}}}\right)$.

      證明 令 ${m_{0i}} = < {X_i},{\alpha _0} > + Z_i^{\rm{T}}{\beta _0}$,${\varepsilon _{i}} = {Y_i} - {g^{ - 1}}({m_{0i}})$,${\tilde m_{0i}} = < {X_i},\tilde \alpha > + Z_i^{\rm{T}}{\beta _0}$. 由泰勒展式可知:

      $\qquad \frac{{\partial {\rm{{\rm{l\tilde n}}}}(\beta )}}{{\partial \beta }}{|_{\beta = \tilde \beta }} - \frac{{\partial {\rm{{\rm{l\tilde n}}}}(\beta )}}{{\partial \beta }}{|_{\beta = {\beta _0}}} = \frac{{{\partial ^2}{\rm{{\rm{l\tilde n}}}}(\beta )}}{{\partial \beta \partial {\beta ^{\rm{T}}}}}{|_{\beta = \bar \beta }}(\tilde \beta - {\beta _0}),$

      其中 $\bar \beta = \delta \tilde \beta + (1 - \delta ){\beta _0},\delta \in [0,1]$,所以有:

      $\qquad (\tilde \beta - {\beta _0}) = - {\left[ {\frac{{{\partial ^2}{\rm{l\tilde n}}(\beta )}}{{\partial \beta \partial {\beta ^{\rm{T}}}}}{|_{\beta = \bar \beta }}} \right]^{{\rm{ - }}1}}\frac{{\partial {\rm{l\tilde n}}(\beta )}}{{\partial \beta }}{|_{\beta = {\beta _0}}}.$

      對于 $\dfrac{{\partial {\rm{l\tilde n}}(\beta )}}{{\partial \beta }}{|_{\beta = {\beta _0}}}$ 有:

      $\qquad \frac{{\partial {\rm{l\tilde n}}(\beta )}}{{\partial \beta }}{|_{\beta = {\beta _0}}} = \frac{1}{n}\sum\limits_{i = 1}^n {{q_1}} ({m_{0i}},{Y_i}){Z_i} + \frac{1}{n}\sum\limits_{i = 1}^n {[{q_1}} ({\tilde m_{0i}},{Y_i}) - {q_1}({m_{0i}},{Y_i})]{Z_i}.$

      因為 ${q_1}({m_{0i}},{Y_i}) \!=\! \{ {Y_i} \!-\! {g^{ - 1}}({m_{0i}})\} {\rho _1} \!=\! {\varepsilon _{i}}{\rho _1}$,$E\left( {{\varepsilon _{i}}|{X_i},{Z_i}} \right) \!=\! 0$,則由條件(A4),(A8)和獨立性可推得

      ${\left\| {\dfrac{1}{n}\!\displaystyle\sum\limits_{i = 1}^n \!\!{{q_1}} ({m_{0i}},{Y_i}){Z_i}} \right\|_2}\!\! = {O_p}\left({n^{ - \frac{1}{2}}}\right)$.

      注意到在條件(A7)下有:

      $\qquad \left\| {\frac{1}{n}\sum\limits_{i = 1}^n {[{q_1}} ({{\tilde m}_{0i}},{Y_i}) - {q_1}({m_{0i}},{Y_i})]{Z_i}} \right\|_2^2 \leqslant C{n^{ - 2}}\sum\limits_{k = 1}^p {\{ \sum\limits_{i = 1}^n {|{{\tilde m}_{0i}} - {m_{0i}}|} } |{Z_{ik}}|{\} ^2}, $

      又因為 $|{\tilde m_{0i}} - {m_{0i}}||$$||{X_i}|| \cdot ||\tilde \alpha - {\alpha _0}||$,則由條件(A1)、(A6)和 $|\tilde \alpha (t) - {\alpha _0}(t){|_\infty }$$CN_n^{ - q}$ 可知 $\Biggr\| \dfrac{1}{n}\displaystyle\sum\limits_{i = 1}^n {[{q_1}} ({{\tilde m}_{0i}},{Y_i}) - {q_1}({m_{0i}},{Y_i})]{Z_i} \Biggr\|_2 = {O_p}({n^{ - \frac{1}{2}}})$,因而 ${\left\| {\dfrac{{\partial {\rm{l\tilde n}}(\beta )}}{{\partial \beta }}{|_{\beta = {\beta _0}}}} \right\|_2} = {O_p}\left({n^{ - \frac{1}{2}}}\right)$.

      對于 ${M_n} \equiv \dfrac{{{\partial ^2}{\rm{l\tilde n}}(\beta )}}{{\partial \beta \partial {\beta ^{\rm{T}}}}}{|_{\beta = \bar \beta }}$,由條件(A5),(A7)及引理1可知 $c$${\lambda _{\min }}\left( {{M_n}} \right) < {\lambda _{\max }}\left( {{M_n}} \right)$$C$,因此 ${\left\| {M_n^{ - 1}} \right\|_2} = O(1),\; a.s.$,從而 $||\tilde \beta - \beta |{|_2} = {O_p}\left({n^{ - \frac{1}{2}}}\right)$,證畢.

      引理 3 在條件(A1)-(A8)下成立的情況下,有 $||\hat \theta - \tilde \theta |{|_2} = {O_p}\left(N_n^{\frac{{1 - 2q}}{2}} + {n^{ - \frac{1}{2}}}N_n^{\frac{1}{2}}\right)$.

      證明 令

      $\qquad {\rm{l\tilde n}}(\theta ) = {n^{ - 1}}\sum\limits_{{i} = 1}^n {Q\{ {g^{ - 1}}(B_i^{\rm{T}}b + Z_i^{\rm{T}}\beta ),{Y_i}\} } ,$

      其中 $\theta = {({b^{\rm{T}}},{\beta ^{\rm{T}}})^{\rm{T}}}$,$\hat \theta = {({\hat b^{\rm{T}}},{\hat \beta ^{\rm{T}}})^{\rm{T}}}$,$\tilde \theta = {({\tilde b^{\rm{T}}},{\tilde \beta ^{\rm{T}}})^{\rm{T}}}$,${{{\tilde m}}_i}$$ = < {X_i},\tilde \alpha > + Z_i^{\rm{T}}\tilde \beta = B_i^{\rm{T}}\tilde b + Z_i^{\rm{T}}\tilde \beta $. 由泰勒展開得:

      $\qquad \frac{{\partial \ln(\theta )}}{{\partial \theta }}{|_{\theta = \hat \theta }} - \frac{{\partial \ln(\theta )}}{{\partial \theta }}{|_{\theta = \tilde \theta }} = \frac{{{\partial ^2}\ln(\theta )}}{{\partial \theta \partial {\theta ^{\rm{T}}}}}{|_{\theta = \bar \theta }}(\hat \theta - \tilde \theta ),$

      其中 $\bar \theta = \delta \hat \theta + (1 - \delta )\tilde \theta ,\delta \in [0,1]$,因此 $(\hat \theta - \tilde \theta ) = - {\left[ {\dfrac{{{\partial ^2}\ln(\theta )}}{{\partial \theta \partial {\theta ^{\rm{T}}}}}{|_{\theta = \bar \theta }}} \right]^{{\rm{ - }}1}}\dfrac{{\partial \ln(\theta )}}{{\partial \theta }}{|_{\theta = \tilde \theta }}$. 注意到

      $\qquad \frac{{\partial \ln(\theta )}}{{\partial b}}{|_{\theta = \tilde \theta }} = \frac{1}{n}\sum\limits_{i = 1}^n {{q_1}} ({m_{0i}},{Y_i}){B_i} + \frac{1}{n}\sum\limits_{i = 1}^n {[{q_1}} ({\tilde m_i},{Y_i}) - {q_1}({m_{0i}},{Y_i})]{B_i},$

      $\qquad \frac{{\partial \ln(\theta )}}{{\partial \beta }}{|_{\theta = \tilde \theta }} = \frac{1}{n}\sum\limits_{i = 1}^n {{q_1}} ({m_{0i}},{Y_i}){Z_i} + \frac{1}{n}\sum\limits_{i = 1}^n {[{q_1}} ({\tilde m_i},{Y_i}) - {q_1}({m_{0i}},{Y_i})]{Z_i}.$

      類似于引理2的推導,由條件(A1),(A4),(A8)和獨立性可得 ${\left\| {\dfrac{1}{n}\displaystyle\sum\limits_{i = 1}^n {{q_1}} ({m_{0i}},{Y_i}){B_i}} \right\|_2} =$ ${O_p}\left({n^{ - \frac{1}{2}}}N_n^{\frac{1}{2}}\right)$. 由引理2及條件(A1),(A6),(A7)可推得

      $\qquad {\left\| {\frac{1}{n}\sum\limits_{i = 1}^n {[{q_1}} ({{\tilde m}_{0i}},{Y_i}) - {q_1}({m_{0i}},{Y_i})]{Z_i}} \right\|_2} = {O_p}\left({n^{ - \frac{1}{2}}}N_n^{\frac{1}{2}} + N_n^{\frac{1}{2} - q}\right),$

      從而可知 ${\left\| {\dfrac{{\partial \ln(\theta )}}{{\partial b}}{|_{\theta \!=\! \tilde \theta }}} \right\|_2} \!\!\!=\! {O_p}\left({n^{ - \frac{1}{2}}}N_n^{\frac{1}{2}} + N_n^{\frac{1}{2} \!-\! q}\right)$. 同樣地,可證明 ${\left\| {\dfrac{{\partial \ln(\theta )}}{{\partial \beta }}{|_{\theta \!=\! \tilde \theta }}} \right\|_2} \!\!\!=\! {O_p}\left({n^{ - \frac{1}{2}}} \!+\! N_n^{ - q}\right)$,綜合可知 ${\left\| {\dfrac{{\partial \ln(\theta )}}{{\partial \theta }}{|_{\theta = \tilde \theta }}} \right\|_2} \!\!\!= {O_p}\left({n^{ - \frac{1}{2}}}N_n^{\frac{1}{2}} + N_n^{\frac{1}{2} - q}\right)$.

      對于 ${V_n} \equiv $$\dfrac{{{\partial ^2}\ln(\theta )}}{{\partial \theta \partial {\theta ^{\rm{T}}}}}{|_{\theta = \tilde \theta }} = \dfrac{1}{n}\displaystyle\sum\limits_{{i} = 1}^n {{q_2}(D_i^{\rm{T}}\bar \theta ,{Y_i})D_i^{\rm{T}}{D_i}}$,由條件(A7)和引理1可得 ${\left\| {{\rm{V}}_n^{ - 1}} \right\|_2} = O(1)\;{\rm{a}}{\rm{.s}}{\rm{.}}$,因此,綜合之前結論可得:

      $\qquad ||\hat \theta - \tilde \theta |{|_2} = {O_p}\left(N_n^{\frac{{1 - 2q}}{2}} + {n^{ - \frac{1}{2}}}N_n^{\frac{1}{2}}\right),$

      證畢.

      定理1的證明:

      由柯西不等式可知:

      $\qquad ||\hat \alpha (t) - {\alpha _0}(t)|{|^2} = ||\hat \alpha (t) - \tilde \alpha (t) + \tilde \alpha (t) - {\alpha _0}(t)|{|^2} \leqslant 2||\hat \alpha (t) - \tilde \alpha (t)|{|^2} + 2||\tilde \alpha (t) - {\alpha _0}(t)|{|^2}. $

      由文獻[24]的定理XII.1可知 $||\tilde \alpha (t) - {\alpha _0}(t)|{|^2} = O(N_n^{ - 2q})$. 由引理3和文獻[31]中的定理4.2可得:

      $\qquad ||\hat \alpha (t) - \tilde \alpha (t)|{|^2} = \left\|\sum\limits_{k = {{1}}}^{{N_n}} {{\phi _k}} ({\hat b_k} - {\tilde b_k})\right\|^2\leqslant {{C}}|{{|\hat b}} - \tilde b||_2^2\leqslant {{C}}||\hat \theta - \tilde \theta ||_2^2 = {O_p}\left(N_n^{1 - 2q} + {n^{ - 1}}{N_n}\right), $

      綜合以上結果可得 $||\hat \alpha (t) - {\alpha _0}(t)|| = {O_p}\left(N_n^{\frac{1}{2} - q} + N_n^{\frac{1}{2}}{n^{ - \frac{1}{2}}}\right)$,證畢.

      定理2的證明:定理 2的證明與文獻[27]中定理2的證明類似. 定義集合:

      $\qquad {{\rm M}_n} = \{ m(x,z) = < x,f > + {z^{\rm{T}}}\beta ,f \in {S_{r,J}}\} ,$

      由條件(A1),(A9)和文獻[24]定理XII.1可知存在 $S(x)$ 的一個估計

      $\qquad {{\hat S}}(x) = {( < x,{\hat \alpha _1} > , \cdots , < x,{\hat \alpha _p} > )^{\rm{T}}}, $

      使得 $|{{|}}S(X) - \hat S(X)|{{{|}}_2} = {\rm{O}}(N_n^{ - q}),\;{\rm{a}}{\rm{.s}}{\rm{.}}$. 令

        $\hat m(X,Z) = {Z^{\rm{T}}}\hat \beta + \displaystyle\int {X(t)\hat \alpha (t){\rm{d}}t}$,    ${\hat m_v}(X,Z) = \hat m(X,Z) + {v^{\rm{T}}}(Z - \hat S(X)) = < X,\hat \alpha - {v^{\rm{T}}}\hat S(X) > + {(\hat \beta + v)^{\rm{T}}}Z$,

        $\ln ({\hat m_v}) = {n^{ - 1}}\displaystyle\sum\limits_{i = 1}^n {Q\{ {g^{ - 1}}[{{\hat m}_v}({A_i})],{Y_i}\} }$,且 ${\hat m_{i}} = \hat m({A_i})$.

      則當 $v = 0$ 時,在所有的 $m \in {{\rm M}_n}$ 中,${\hat m_v}$ 極大化了函數 $\ln(m) = {n^{ - 1}}\displaystyle\sum\limits_{i = 1}^n {Q\{ {g^{ - 1}}[m({A_i})],{Y_i}\} }$. 因此可知:

      $\qquad 0 \equiv \frac{{\partial \ln({{\hat m}_v})}}{{\partial v}}{|_{v = 0}} = \frac{{\partial ({n^{ - 1}}\displaystyle\sum\limits_{i = 1}^n {Q\{ {g^{ - 1}}[{{\hat m}_v}({A_i})],{Y_i}\} )} }}{{\partial v}}{|_{v = 0}} = \frac{1}{n}\sum\limits_{i = 1}^n {{q_1}({{\hat m}_i},{Y_i}){{\bar Z}_i}} + {O_p}(N_n^{ - q}).$

      根據泰勒展式可得:

      $\qquad \begin{split} \frac{1}{n}\sum\limits_{i = 1}^n {{q_1}({{\hat m}_i},{Y_i}){{\bar Z}_i}} =& \frac{1}{n}\sum\limits_{i = 1}^n {{q_1}({m_{0i}},{Y_i}){{\bar Z}_i}} + \frac{1}{n}\sum\limits_{i = 1}^n {{q_2}({m_{0i}},{Y_i})({{\hat m}_i} - {m_{0i}}){{\bar Z}_i}} + \frac{1}{{2n}}\sum\limits_{i = 1}^n {q_2^{'}({{\bar m}_i},{Y_i}){{({{\hat m}_i} - {m_{0i}})}^2}{{\bar Z}_i}}=\\ &{\rm{I + II + III,}} \end{split} $

      其中 ${\bar m_{i}}$${\hat m_{i}}$${m_{{{0i}}}}$ 之間. 易知 $E{q_1}({m_0}(A),Y)\bar Z = 0$$Eq_1^2({m_0}(A),Y){\bar Z^{ \otimes 2}} = E\{ \rho _1^2[{m_0}(A)]{\bar Z^{ \otimes 2}}E[Y - {g^{ - 1}}({m_0}(A))]^2|A\} = E{\rho _2}({m_0}(A)){\bar Z^{ \otimes 2}} = \Omega$. 則根據中心極限定理可得:${n^{ - \frac{1}{2}}}\displaystyle\sum\limits_{i = 1}^n {{q_1}({m_{0i}},{Y_i}){{\bar Z}_i}} \xrightarrow{{\rm{D}}}N(0,\Omega )$.

      對于 ${\rm I}{\rm I}$ 有如下分解:

      $\qquad \begin{split} {\rm{II}} =& \frac{1}{n}\sum\limits_{i = 1}^n {{q_2}} ({m_{0i}},{Y_i}){{\bar Z}_i}\int {{X_i}(t)[\hat \alpha (t) - {\alpha _0}(t)]} dt + \frac{1}{n}\sum\limits_{i = 1}^n {{q_2}} ({m_{0i}},{Y_i}){{\bar Z}_i}{S^{\rm{T}}}({X_i})(\hat \beta - {\beta _0}) + \\ &\frac{1}{n}\sum\limits_{i = 1}^n {{q_2}} ({m_{0i}},{Y_i})\bar Z_i^{ \otimes 2}(\hat \beta - {\beta _0}) = {\rm{I}}{{\rm{I}}_1} + {\rm{I}}{{\rm{I}}_2} + {\rm{I}}{{\rm{I}}_3}. \end{split} $

      對于 ${\rm I}{{\rm I}_1}$ 又可分解為

      $\qquad \begin{split} {\rm{I}}{{\rm{I}}_1} = \frac{1}{n}\sum\limits_{i = 1}^n {{q_2}({m_{0i}},{Y_i})} \int {{X_i}(t)[\hat \alpha (t) - \tilde \alpha (t)]} {\rm{d}}t{{\bar Z}_i} + \frac{1}{n}\sum\limits_{i = 1}^n {{q_2}({m_{0i}},{Y_i})} \int {{X_i}(t)[\tilde \alpha (t) - {\alpha _0}(t)]} {\rm{d}}t{{\bar Z}_i} = {\rm{I}}{{\rm{I}}_{11}} + {\rm{I}}{{\rm{I}}_{12}}, \end{split} $

      對于 ${\rm I}{{\rm I}_{11}}$ 中任意第 $l$ 個元素有:

      $\qquad {\rm I}{{\rm I}_{11l}} = \sum\limits_{j = 1}^{{N_n}} {({{\hat b}_j}} - {\tilde b_j})\{ {n^{ - 1}}\sum\limits_{i = 1}^n {{\varepsilon _i}} \rho _1^{'}({m_{0i}}) < {X_i},{\phi _j} > {\bar Z_{il}}\} - \sum\limits_{j = 1}^{{N_n}} {({{\hat b}_j}} - {\tilde b_j})\{ {n^{ - 1}}\sum\limits_{i = 1}^n {{\rho _2}({m_{0i}}) < {X_i},{\phi _j} > {{\bar Z}_{il}}} \} .$

      由柯西施瓦茲不等式可得:

      $\qquad |\sum\limits_{j = 1}^{{N_n}} {({{\hat b}_j}} - {\tilde b_j})\bigg\{ {n^{ - 1}}\sum\limits_{i = 1}^n {{\varepsilon _i}} \rho _1^{'}({m_{0i}}) < {X_i},{\phi _j} > {\bar Z_{il}}\bigg\} |\leqslant{\bigg\{ \sum\limits_{j = 1}^{{N_n}} {({{\hat b}_j}} - {\tilde b_j})^2}{\bigg\} ^{\frac{1}{2}}}{\bigg\{ \sum\limits_{j = 1}^{{N_n}} {[{n^{ - 1}}\sum\limits_{i = 1}^n {{\varepsilon _i}} \rho _1^{'}({m_{0i}}) < {X_i},{\phi _j} > {{\bar Z}_{il}}} ]^2}{\bigg\} ^{^{\frac{1}{2}}}}, $

      結合條件(A4)和引理3可推得:

      $\qquad \sum\limits_{j = 1}^{{N_n}} {({{\hat b}_j}} - {\tilde b_j})\{ {n^{ - 1}}\sum\limits_{i = 1}^n {{\varepsilon _i}} \rho _1^{'}({m_{0i}}) < {X_i},{\phi _j} > {\bar Z_{il}}\} = O{}_p(N_n^{1 - q}{n^{ - \frac{1}{2}}} + {N_n}{n^{ - 1}}) = {o_p}({n^{ - \frac{1}{2}}}).$

      類似地,可以證明 $\displaystyle\sum\limits_{j = 1}^{{N_n}} {({{\hat b}_j}} - {\tilde b_j})\{ {n^{ - 1}}\displaystyle\sum\limits_{i = 1}^n {{\rho _2}({m_{0i}}) < {X_i},{\phi _j} > {{\bar Z}_{il}}} \} = {o_p}({n^{ - \frac{1}{2}}})$,因此有 ${\rm I}{{\rm I}_{11}} = {o_p}({n^{ - \frac{1}{2}}})$.

      對于 ${\rm I}{{\rm I}_{12}}$ 由條件(A1),(A6)和(A7)可推得:${\rm I}{{\rm I}_{12}} = {O_p}(N_n^{ - q}) = {o_p}({n^{ - \frac{1}{2}}})$.

      因此 ${\rm I}{{\rm I}_1} = {o_p}({n^{ - \frac{1}{2}}})$.

      對于 ${\rm I}{{\rm I}_2}$,由于 $E{\varepsilon _1}{\rho _1}({m_{01}}){\bar Z_1}{S^{\rm{T}}}({X_1}) = 0$,$E{\rho _2}({m_{01}}){\bar Z_1}{S^{\rm{T}}}({X_1}) = 0$,則由引理2和3可推得:

      $\qquad {\rm I}{{\rm I}_2} = {O_p}\left({n^{ - \frac{1}{2}}}N_n^{\frac{1}{2} - q} + {n^{ - 1}}N_n^{\frac{1}{2}}\right) = {o_p}\left({n^{ - \frac{1}{2}}}\right).$

      對于 ${\rm I}{{\rm I}_3}$ 可以分解為:

      $\qquad {\rm I}{{\rm I}_3} = {n^{ - 1}}\sum\limits_{i = 1}^n {{\varepsilon _i}} \rho _1^{'}({m_{0i}})\bar Z_i^{ \otimes 2}(\hat \beta - {\beta _0}) - {n^{ - 1}}\sum\limits_{i = 1}^n {{\rho _2}({m_{0i}})\bar Z_i^{ \otimes 2}(\hat \beta - {\beta _0})} .$

      類似于 ${\rm I}{{\rm I}_2}$ 可以證明 ${n^{ - 1}}\displaystyle\sum\limits_{i = 1}^n {{\varepsilon _i}} \rho _1^{'}({m_{0i}})\bar Z_i^{ \otimes 2}(\hat \beta - {\beta _0}) = {o_p}\left({n^{ - \frac{1}{2}}}\right)$,根據大數定理可得:

      $\qquad {n^{ - 1}}\sum\limits_{i = 1}^n {{\rho _2}({m_{0i}})\bar Z_i^{ \otimes 2}(\hat \beta - {\beta _0})} = (\Omega + {o_p}(1))(\hat \beta - {\beta _0}),$

      因此 ${\rm I}{{\rm I}_3} = (\Omega + {o_p}(1))(\hat \beta - {\beta _0}) + {o_p}\left({n^{ - \frac{1}{2}}}\right)$.

      ${\rm I}{{\rm I}_1}$,${\rm I}{{\rm I}_2}$,${\rm I}{{\rm I}_3}$ 的結果可知:

      $\qquad {\rm I}{\rm I} = - (\Omega + {o_p}(1))(\hat \beta - {\beta _0}) + {o_p}\left({n^{ - \frac{1}{2}}}\right).$

      對于 ${\rm I}{\rm I}{\rm I}$,由條件(A1)和(A5)可得:

        ${({\hat m_i} - {m_{0i}})^2} = {[ < {X_i},\hat \alpha - {\alpha _0} > + Z_i^{\rm{T}}(\hat \beta - {\beta _0})]^2}$$C(||\hat \alpha - {\alpha _0}|{|^2} + ||\hat \beta - {\beta _0}||_2^2)$,a.s..

      結合條件(A6),(A7)及引理3可得:${\rm I}{\rm I}{\rm I} = {O_p}(N_n^{1 - 2q} + {n^{ - 1}}{N_n}) = {o_p}({n^{ - \frac{1}{2}}})$.

      綜合 ${\rm I}$,${\rm I}{\rm I}$,${\rm I}{\rm I}{\rm I}$ 的結論,由Slutsky定理可得:$\sqrt n (\hat \beta - {\beta _0})\xrightarrow{{{D}}}N(0,{\Omega ^{ - 1}})$,證畢.

    • 本文討論了廣義部分函數型線性回歸模型的多項式樣條估計,在一定的正則條件下得到了估計的漸近性質. 同時,通過數值模擬說明了該方法的有效性,且發現當真實的斜率函數不能表示為隨機函數協方差算子的少數幾個特征函數的線性組合時,多項式樣條方法比函數型主成份方法估計效果更好.

參考文獻 (31)

目錄

    /

    返回文章
    返回