StataNow較新 | 線性回歸的貝葉斯變量選擇

    Stata2024.10.17知乎

    使用新的bayesselect命令,您可以執(zhí)行線性回歸的貝葉斯變量選擇??紤]模型不確定性并執(zhí)行貝葉斯推理?,F(xiàn)在該命令已較新到StataNow?中。


    回歸分析的一個常見問題是,當(dāng)您有許多潛在的預(yù)測變量時,如何確定與結(jié)果較相關(guān)的預(yù)測變**集。變量選擇,也稱為稀疏回歸,可以幫助研究人員提高模型的可解釋性并提供較穩(wěn)定的推理。


    Stata的貝葉斯套件現(xiàn)在包含一個新命令bayesselect,它為線性模型實(shí)現(xiàn)貝葉斯變量選擇。bayesselect補(bǔ)充了與變量選擇相關(guān)的Stata命令,例如lasso和bmaregress。


    貝葉斯選擇提供了一種靈活的貝葉斯變量選擇方法,通過使用各種專門設(shè)計的系數(shù)先驗(yàn),如global–local shrinkage先驗(yàn)和spike-and-slab先驗(yàn)。bayesselect完全集成在 Stata 的貝葉斯套件中,并與所有貝葉斯后估計例程無縫協(xié)作。


    示例

    以diabetes 數(shù)據(jù)集為例,其中包含442名患者的疾病進(jìn)展記錄以及年齡、性別、體重指數(shù)、血壓和血清測量值等控制因素(Efron et al. 2004)。

     11  

    按照變量選擇方法中的常見程序,所有變量都經(jīng)過標(biāo)準(zhǔn)化,以便它們的平均值為0,標(biāo)準(zhǔn)差為1。我們要的結(jié)果變量是diabetes,我們對其他10個變量進(jìn)行回歸分析。我們假設(shè)并非所有協(xié)變量都具有同等重要性,并且通過執(zhí)行變量選擇,我們可以實(shí)現(xiàn)較有效的推理和較好的預(yù)測。


    使用bayesselect執(zhí)行貝葉斯變量選擇與Stata 中的任何其他回歸一樣簡單。我們使用bayesselect的默認(rèn)規(guī)范,并且我們添加的一選項是rseed()以實(shí)現(xiàn)可重復(fù)性。擬合模型時,我們排除最后一個觀測值(*442個觀測值)作為測試示例。

    22

    bayesselect使用的默認(rèn)變量選擇先驗(yàn)是horseshoe先驗(yàn)(Carvalho et al. 2009)。這是所謂的global–local shrinkage先驗(yàn)的一種特殊情況,其中包括local shrinkage因子lambdas,每個系數(shù)對應(yīng)一個。這種先驗(yàn)的形式是在命令的模型匯總中描述的。

     

    收縮因子轉(zhuǎn)換為包含系數(shù)并匯總在bayesselect輸出的最后一列中。輸出中的預(yù)測變量按估計的包含系數(shù)排序。包含系數(shù)大于0.5的**個預(yù)測變量是serum5, bmi(體重指數(shù))和bp(血壓)。這三個預(yù)測變量都對結(jié)果產(chǎn)生積極影響——其系數(shù)的后驗(yàn)均值估計值分別為 0.34、0.33 和 0.19。


    在*二個輸出表中,位于系數(shù)表下方,bayesselect報告常數(shù)項、方差項sigma2和全局收縮參數(shù)tau的后驗(yàn)匯總。


    因?yàn)槲覀兿胍A(yù)測,所以我們首先需要保存bayesselect的模擬結(jié)果。

      33

    我們現(xiàn)在可以使用bayespredict命令來預(yù)測研究中最后一位患者(觀察值 442)的疾病進(jìn)展。

      44

    計算出的后驗(yàn)預(yù)測平均值保存在新變量pmean1中。我們稍后會看看這個預(yù)測。

    55

    另一種流行的變量選擇模型是spike-and-slab lasso模型(Ro?ková and George 2018)。我們通過在bayesselect中*sslaplace選項來請求此模型。

      

    spike-and-slab lasso的輸*的是包含概率,而不是horseshoe 先驗(yàn)?zāi)P偷陌禂?shù),這較*解釋。預(yù)測變量seric5、bmi和bp都包含1。換句話說,這三個預(yù)測變量的重要性沒有不確定性。然而,它們的系數(shù)估計與horseshoe模型的系數(shù)估計相似??傮w而言,包含概率比horseshoe模型的包含系數(shù)( 0.2 ~ 0.7 )較分散,age從0.1到1不等。


    讓我們保存最后的模擬結(jié)果并對研究中的最后一位患者進(jìn)行預(yù)測。

      66

    為了比較兩個變量選擇模型的預(yù)測結(jié)果,我們列出了442的觀測記錄。

      77

    spike-and-slab模型的預(yù)測 (-1.18) 比horseshoe模型的預(yù)測 (-1.31) 較接近真實(shí)值 (-1.23)。總之,兩種模型都正確預(yù)測了該患者疾病進(jìn)展的減緩。


    參考文獻(xiàn)

    Efron, B., T. J. Hastie, I. Johnstone, and R. J. Tibshirani. 2004. Least angle regression. Annals of Statistics 32: 407–499.

     

    Carvalho, C. M., N. G. Polson, and J. G. Scott. 2009. "Handling sparsity via the horseshoe". In Proceedings of the Twelfth International Conference on Artificial Intelligence and Statistics. Proceedings of Machine Learning Research, ed. D. van Dyk and M. Welling, vol 5: 73–80. Clearwater Beach, FL.


    Ro?ková, V., and E. I. George. 2018. The spike-and-slab lasso. Journal of the Royal Statistical Society, Series B 113: 431–444.


    北京天演融智軟件有限公司(科學(xué)軟件網(wǎng))是Stata軟件在中國的授權(quán)經(jīng)銷商,為中國的軟件用戶提供優(yōu)質(zhì)的軟件銷售和培訓(xùn)服務(wù)。


    北京天演融智軟件有限公司專注于pscad,gams,spsspro,stata,matlab,mathematica,nvivo等, 歡迎致電 18510103847

  • 詞條

    詞條說明

  • 云考試職能

    每年,各種考試測驗(yàn)的紙質(zhì)試卷印刷量巨大,有些高校甚至設(shè)置了印刷廠來負(fù)責(zé)校內(nèi)各類考試的試卷印刷工作。而且,試卷的印刷、運(yùn)輸、評判等各個環(huán)節(jié)上的安全性風(fēng)險和高效性上的弊端日趨顯現(xiàn)。隨著互聯(lián)別是移動互聯(lián)網(wǎng)的發(fā)展,在線考試在技術(shù)迭代、特別是安全性上已達(dá)到了**的高度。在線考試的應(yīng)用場景和范圍隨著技術(shù)的進(jìn)步和創(chuàng)新得以不斷的拓展。在“互聯(lián)網(wǎng)+”時代,在線考試,完全通過互聯(lián)網(wǎng)實(shí)現(xiàn)考試的組織、管理和運(yùn)營,考試

  • Enerplot離線繪圖和分析軟件

    在強(qiáng)大的離線環(huán)境中查看、分析和操作測量和模擬數(shù)據(jù)。離線繪圖和分析是許多工程和科學(xué)研究的關(guān)鍵方面。擁有快速有效地查看、分析和修改大量數(shù)據(jù)的工具同樣重要。Enerplot是一個完全自動化的應(yīng)用程序,允許您以閃電般的速度執(zhí)行高度重復(fù)的任務(wù)。您可以使用嵌入Python接口編寫腳本,或者記錄您的操作來創(chuàng)建自定義腳本宏。應(yīng)用程序級函數(shù)包括加載數(shù)據(jù)、創(chuàng)建圖形和生成曲線。此外,Enerplot的Python數(shù)學(xué)庫

  • 石景山地球地理軟件流程

    石景山地球地理軟件流程 地球地理軟件在如今科技高速發(fā)展的時代,扮演著愈發(fā)重要的角色。北京天演融智軟件有限公司(科學(xué)軟件網(wǎng))在地球地理軟件領(lǐng)域提供著一系列產(chǎn)品和服務(wù)。通過其強(qiáng)大的技術(shù)支持、豐富的資源庫和用戶友好的特點(diǎn),為用戶提供了的解決方案。讓我們深入了解一下“石景山地球地理軟件流程”。 產(chǎn)品與服務(wù) 科學(xué)軟件網(wǎng)作為北京天演融智軟件有限公司的官方平臺,提供了過800款正版軟件,覆蓋了多個領(lǐng)域,其中就包

  • 公益活動|Stata研討會及系列講座

    武漢大學(xué)經(jīng)濟(jì)與管理學(xué)院關(guān)于舉辦“*二屆Stata洞察數(shù)據(jù)科學(xué)研討會”的通知為了讓國內(nèi)用戶再次分享和學(xué)習(xí)Stata在數(shù)據(jù)分析領(lǐng)域的**經(jīng)驗(yàn),武漢大學(xué)經(jīng)濟(jì)與管理學(xué)院聯(lián)合Stata中國授權(quán)代理北京天演融智軟件有限公司,舉辦*二屆“Stata洞察數(shù)據(jù)科學(xué)研討會”。本次會議為公益性會議,不收取任何費(fèi)用。相關(guān)會議信息如下:?主辦單位:武漢大學(xué)經(jīng)濟(jì)與管理學(xué)院?北京天演融智軟件有限公司(科學(xué)軟

聯(lián)系方式 聯(lián)系我時,請告知來自八方資源網(wǎng)!

公司名: 北京天演融智軟件有限公司

聯(lián)系人: 王經(jīng)理

電 話: 4008104001

手 機(jī): 18510103847

微 信: 18510103847

地 址: 北京海淀北京市海淀區(qū)上地東路35號院1號樓3層1-312-318、1-312-319

郵 編:

網(wǎng) 址: turntech8843.b2b168.com

八方資源網(wǎng)提醒您:
1、本信息由八方資源網(wǎng)用戶發(fā)布,八方資源網(wǎng)不介入任何交易過程,請自行甄別其真實(shí)性及合法性;
2、跟進(jìn)信息之前,請仔細(xì)核驗(yàn)對方資質(zhì),所有預(yù)付定金或付款至個人賬戶的行為,均存在詐騙風(fēng)險,請?zhí)岣呔瑁?
    聯(lián)系方式

公司名: 北京天演融智軟件有限公司

聯(lián)系人: 王經(jīng)理

手 機(jī): 18510103847

電 話: 4008104001

地 址: 北京海淀北京市海淀區(qū)上地東路35號院1號樓3層1-312-318、1-312-319

郵 編:

網(wǎng) 址: turntech8843.b2b168.com

    相關(guān)企業(yè)
    商家產(chǎn)品系列
  • 產(chǎn)品推薦
  • 資訊推薦
關(guān)于八方 | 八方幣 | 招商合作 | 網(wǎng)站地圖 | 免費(fèi)注冊 | 一元廣告 | 友情鏈接 | 聯(lián)系我們 | 八方業(yè)務(wù)| 匯款方式 | 商務(wù)洽談室 | 投訴舉報
粵ICP備10089450號-8 - 經(jīng)營許可證編號:粵B2-20130562 軟件企業(yè)認(rèn)定:深R-2013-2017 軟件產(chǎn)品登記:深DGY-2013-3594
著作權(quán)登記:2013SR134025
Copyright ? 2004 - 2024 b2b168.com All Rights Reserved