關于回歸統(tǒng)計學論文
關于回歸統(tǒng)計學論文
回歸分析是確定兩種或兩種以上變量間相互依賴的定量關系的一種統(tǒng)計分析方法。下文是學習啦小編為大家整理的關于回歸統(tǒng)計學論文的范文,歡迎大家閱讀參考!
關于回歸統(tǒng)計學論文篇1
廣西CPI指數(shù)統(tǒng)計數(shù)據(jù)多元回歸分析
摘要:本文針對目前大眾所最關心的物價問題,通過多元回歸分析模型,結(jié)合廣西1999~2009年消費品零售價格和服務項目價格變動相關數(shù)據(jù),分析價格波動對居民消費的影響程度,給出影響廣西CPI指數(shù)上漲的主要因素,并提出相應的措施。
關鍵詞:CPI指數(shù);多元回歸;主成分分析
物價與日常生活息息相關,居民消費物價指數(shù)(CPI)主要包括食品、工業(yè)消費品、服務類(教育、醫(yī)療、交通等)的價格,是根據(jù)與居民生活有關的產(chǎn)品及勞務價格統(tǒng)計出來的物價變動指標。在廣西,居民消費支出是消費的主體且相對薄弱,價格總水平低位運行,但2007年以來居民消費物價指數(shù)增長速度產(chǎn)生了顯著的波動。針對目前大眾所最關心的物價問題,分析消費品零售價格和服務項目價格變動的相關數(shù)據(jù),了解CPI變化規(guī)律和價格波動對居民消費的影響程度,為采取相應的措施提供依據(jù),具有十分重要的意義。
一、建立居民消費價格指數(shù)回歸分析模型
在實際問題的研究和分析中,往往涉及多個變量,國家統(tǒng)計局將構成中國CPI指標的200多種商品和服務分為8個主要的類別。其中,中國CPI中食品的權重占到34%,食品價格的變動對于CPI的變動有很大的影響。下面根據(jù)收集的數(shù)據(jù)建立數(shù)學模型做具體的分析。
由中國統(tǒng)計年鑒和廣西統(tǒng)計年鑒,收集廣西1999~2009年來居民消費價格指數(shù)的有關數(shù)據(jù)。設Y為居民消費價格總指數(shù),考慮的主要因素有:食品x1,煙酒及其用品x2,衣著x3,家庭設備用品和維修服務x4,醫(yī)療保健和個人用品x5,交通和通訊x6,娛樂教育文化用品和服務x7,居住x8。建立多元線性回歸模型。其表達式為:Y=b0+ bixi,式中b0,…,b8為回歸系數(shù)。建模數(shù)據(jù),見表1。
二、用SPSS求回歸系數(shù)及分析
使用SPSS軟件對表1的因變量與所有自變量做相關分析,可得回歸方程:
Y=-8.399+0.282x1+0.191x2+0.111x3+0.071x4+0.015x5+0.089x6+0.118x7+0.21x8(1)
由此可知,所定義的各自變量對居民消費價格指數(shù)Y的影響都比較顯著,且能通過檢驗(F=612.780)。
關于模型是否成立的方差分析結(jié)果,可以看出,自變量對因變量有解釋作用,所建立的線性回歸模型具有合理性。
三、模型的檢驗與分析
建立多元線性回歸數(shù)學模型后,還需要進行檢驗處理,使得到的數(shù)學模型更加完善。
1、擬合優(yōu)度檢驗。
系數(shù)R2=0.998,測度了回歸直線對數(shù)據(jù)的擬合程度,即回歸方程中的8個自變量可以對價格指數(shù)Y進行99.8%的解釋。說明回歸方程的擬合度不錯,模型較好地反映了8個自變量對CPI變動的共同影響?;貧w估計的標準誤差S=0.1478,它是衡量回歸直線代表性大小的統(tǒng)計分析指標,說明樣本回歸效果較好。
2、共線性檢驗與分析。
在實際問題的分析中,往往涉及的自變量個數(shù)較多,這樣在建立模型時就可能會出現(xiàn)嚴重的共線性,也給合理分析問題和解決問題帶來困難。因此,需要對回歸方程中的變量進行共線性診斷,并且確定它們對參數(shù)估計的影響。當變量的方差膨脹因子(VIF)值大于2被認為有共線性問題。由用SPSS軟件分析的共線性診斷表得知,各指標的VIF值都較大,條件指數(shù)大于30,特征根為0或接近于0,表示這些自變量存在多重共線性;常量與煙酒用品、家庭設備及維修這三項的方差比例值均很高,分別為0.94、0.91、0.81,表示三者高度相關。
3、主成分分析。
下面用主成分分析法對模型的原變量進行處理。(表4)表4中前4個主成分特征值的累積貢獻率為90.158%,反映了原指標90.158%的信息,后面的特征值貢獻越來越少,因此,也可用前4個主成分來代替原來的8個指標變量。Z1、Z2、Z3、Z4表示主成分。
成分得分系數(shù)表示某個主成分中,各變量所起作用的大小,其絕對值越大表示主成分對該變量的代表性也越大。其中,第一主成分主要與食品、家庭設備用品及維修服務相關;第二主成分主要與衣著、交通和通訊、娛樂教育文化用品及服務相關;第三主成分主要與煙酒及用品、醫(yī)療保健和個人用品相關;第四主成分與居住呈現(xiàn)高度相關。每個主成分都可由它的特征向量給出主成分方程。用SPSS將得到的4個主成分因子作為自變量建立多元線性回歸方程:Y=101.648+2.878Z1+1.103Z2+0.673Z3+0.619Z4,帶入4個主成分方程可得:Y=101.648+0.9371X1+0.6391X2+0.42X3+0.7054X4+0.0153X5+0.7445X6+0.5489X7+1.0236X8,這里的Xi(i=1,…,8)為標準指標變量。
分析主成分回歸結(jié)果,R2=0.964,方差分析p=0.000,模型擬合較好。
將標準自變量還原為原自變量,得到消除共線影響后的Y與原自變量之間的線性回歸方程:
Y=-78.5485+0.11805x1+0.52518x2+0.22392x3+0.35219x4+0.00609x5+0.20905x6+0.12291x7+0.24395x8(2)
經(jīng)過上述分析可知所得方程(2)比方程(1)更加合理。
四、結(jié)論及建議
通過對模型的分析可知,各自變量均對廣西居民消費價格指數(shù)有正向推動作用。
首先,中國CPI中食品的權重占到34%,食品價格的上漲對于CPI上漲有很大的推動作用。食品價格指數(shù)每提高1%會導致居民消費指數(shù)增長0.282%,標準化回歸系數(shù)Beta=0.685,說明具有非常強的影響效果。廣西第一產(chǎn)業(yè)的發(fā)展較落后,農(nóng)業(yè)生產(chǎn)效率較低,造成農(nóng)產(chǎn)品供求失衡。2009年廣西農(nóng)業(yè)增加值占生產(chǎn)總值比重首次降到20%以下,2010年的西南大旱使得糧食總產(chǎn)量同比下降3.9%,而游資炒作更加推高了廣西部分農(nóng)產(chǎn)品價格。因此,應大力推動現(xiàn)代農(nóng)業(yè)發(fā)展,推廣節(jié)本高效農(nóng)業(yè)技術,保障農(nóng)產(chǎn)品有效供給。政府部門可制定相關的措施抑制主要農(nóng)資價格的上揚,加強農(nóng)業(yè)生產(chǎn)資料和主要農(nóng)產(chǎn)品的市場調(diào)控,穩(wěn)定食品價格。
其次,CPI持續(xù)上漲的主要驅(qū)動因素中居住的上漲趨勢也非常明顯。近年來,廣西北部灣經(jīng)濟區(qū)開發(fā)建設和城鎮(zhèn)化建設快速推進,環(huán)境的改善吸引了外來購買力,從而擴大了對房地產(chǎn)市場的需求。房地產(chǎn)價格的一路攀升,對整體物價的上漲具有很大的刺激作用,成為居民消費的主要支出和生活負擔。建議繼續(xù)加強和改善房地產(chǎn)調(diào)控,采取長效措施遏制房價過快上漲,同時在引導商品房產(chǎn)業(yè)健康發(fā)展的同時,結(jié)合舊城改造大力建設保障性住房,增加住房有效供應,打擊投資投機。
參考文獻:
[1]宋志剛,謝蕾蕾,何旭洪.SPSS16實用[M].北京:科技出版社,2004.
[2]楊凌云,王凡彬,潘瑞,梁杰.CPI指數(shù)預測的統(tǒng)計回歸模型.重慶文理學院學報(自然科學版),2010.2.
[3]李毛俠.安徽省消費需求影響因素的主成分回歸分析.現(xiàn)代物業(yè),2010.2.
關于回歸統(tǒng)計學論文篇2
對統(tǒng)計中相關分析與回歸分析的論述
摘要:客觀事物之間存在一定的依存關系,對這種關系的分析具有重要意義。本文闡述了相關分析與回歸分析的概念,提出了分析中應注意的問題。
關鍵詞:依存關系;相關分析;回歸分析;
一切客觀事物都是互相聯(lián)系的。而且每一事物的運動都和它的周圍其它事物相聯(lián)系互相影響??陀^現(xiàn)象間的互相聯(lián)系,可以通過一定的數(shù)量關系反映出來。例如氣溫與降雨量之間,消費品需求量與居民收入水平之間,勞動生產(chǎn)率與產(chǎn)品成本之間,投入與產(chǎn)出之間等等,都存在著一定的依存關系。
一、相關分析與回歸分析的概念。
(一)客觀現(xiàn)象之間存在的互相依存關系叫相關關系,對現(xiàn)象之間相關關系密切程度的研究,叫相關分析。相關分析具有如下兩個特點。
1.現(xiàn)象之間確實存在著數(shù)量上的依存關系。
如果一個現(xiàn)象發(fā)生數(shù)量上的變化,則另一個現(xiàn)象也會相應地發(fā)生數(shù)量上的變化。例如商品流通費增加,一般商品銷售額也會增加,反過來,如果商品銷售額增加,一般商品流通費也要增加。身材較高的人,一般體重也較重。反過來,體重較重的人,一般身材也較高。再如,年齡與血壓、播種量與糧食收獲量之間等等都有數(shù)量上的依存關系。
2.現(xiàn)象之間數(shù)量上的關系不是確定的。
相關關系的全稱為統(tǒng)計相關關系,它屬于變量之間的一種不完全確定的關系。這意味著一個變量雖然受另一個(或一組)變量影響,卻并不由這一個(或一組)變量完全確定。例如,身高1.7米的人其體重有許多個值;體重為60公斤的人,其身高也有許多個值。身高與體重之間沒有完全嚴格確定的數(shù)量關系存在。再如產(chǎn)品單位成本和勞動生產(chǎn)率的變動之間存在著一定的依存關系,但是除了勞動生產(chǎn)率的變動以外,還會受到材料消耗、設備折舊、能源耗用以及管理費用等諸因素變動的影響。
由此可見,相關關系是現(xiàn)象間確實存在的,但相關關系數(shù)值是不完全確定的相互依存關系。
(二)回歸分析的概念。相關關系說明現(xiàn)象間有關系,但它不能說明一個現(xiàn)象發(fā)生一定量的變化。也就是說,它不能說明兩個變量之間的一般關系值。
回歸分析是指對具有相關關系的現(xiàn)象,根據(jù)其關系形態(tài),選擇一個適合的數(shù)學模型(稱為回歸方程式),用來近似的表示變量間的平均變化關系的一種統(tǒng)計分析方法。它實際上是相關現(xiàn)象間不確定、不規(guī)則的數(shù)量關系一般化、規(guī)則化。
二、相關分析與回歸分析的區(qū)別與聯(lián)系
(一)、相關分析與回歸分析的區(qū)別:
1.相關分析所研究的兩個變量是對等關系,回歸分析所研究的兩個變量不是對等關系,必須根據(jù)研究目的,先確定其中一個是自變量,另一個是因變量。
2.對兩個變量x和y來說,相關分析只能計算出―個反映出一個反映兩個變量間相關密切程度的相關系數(shù),計算中改變x和y的地位不影響相關系數(shù)的數(shù)值;回歸分析有時可以根據(jù)研究目的不同分別建立兩個不同的回歸方程。以x自變量,y為因變量,可以得出y對x的回歸方程。以y為自變量,x為因變量,可得出x對y的回歸方程。
3.相關分析對資料的要求是,兩個變量都必須是隨機變量,而回歸分析對資料的要求是,自變量是可以控制的變量(給定的變量),因變量是隨機變量。
(二)、相關分析與回歸分析的聯(lián)系
1.相關分析是回歸分析的基礎和前提。如果缺少相關關系,沒有從定性上說明現(xiàn)象間是否具有相關關系,沒有對相關關系的密切程度作出判斷,就不能進行回歸分析,即便勉強進行了回歸分析,也是沒有實際意義的。
2.回歸分析是相關分析的深入和繼續(xù)。僅僅說明現(xiàn)象具有密切的相關關系是不夠的,只有進行了回歸分析,擬合了回歸方程,才可能進行有關分析的回歸預測,相關分析才有實際的意義。因此,如果僅有回歸分析而缺少相關分析,將會因為缺乏必要的基礎和前提而影響回歸分析的可靠性;如果僅有相關分析而缺少回歸分析,就會降低相關分析的意義。只有把兩者結(jié)合起來,才能達到統(tǒng)計分析的目的。
三、應用相關分析與回歸分析應注意的問題
(一)在定性分析的基礎上進行定量分析
在定性分析的基礎上進行定量分析,是保證正確運用相關分析和回歸分析的必要條件。也就是在確定哪些變量作自變量,哪些變量作因變量之前,必須對所研究的問題有充分正確的認識。相關分析的方法解釋不了相關關系產(chǎn)生的原因,它本身不能判斷現(xiàn)象之間是否存在相關關系。
(二)要注意現(xiàn)象質(zhì)的界限及相關關系作用的范圍
在進行相關分析和回歸分析時要注意現(xiàn)象質(zhì)的界限及相關關系作用的范圍。超出了這個范圍,分析結(jié)果就會歪曲事實。我們用數(shù)學模型得到的回歸方程,一般都是根據(jù)一定范圍內(nèi)的有限資料來計算的,其有效性,一般只適用于該范圍內(nèi),不適宜用于該范圍外。也就是說利用回歸方程,一般只適宜用于內(nèi)插預測,不宜用于外推預測。這是因為最小平方法指的是對現(xiàn)有資料范圍配合一條“最佳”線,如果外推到范圍以外,就不一定是“最佳”線了。根據(jù)樣本數(shù)據(jù)所建立的回歸方程的代表了經(jīng)濟變量之間的數(shù)量關系,這種關系是在一定條件下建立的,因此也只能在一定的條件下才能夠成立,忽視了相關關系建立的條件,把這種關系無限制地向外推廣是不正確的,由此得到的結(jié)論是值得懷疑的。例如施肥量和農(nóng)作物生產(chǎn)量只在一定的范圍內(nèi)才具有正相關關系。
(三)要具體問題具體分析
回歸方程是根據(jù)實際統(tǒng)計資料計算的,一般是一種經(jīng)驗公式。因此在分析時一定要注意具體問題具體分析。若條件發(fā)生變化,不能機械照搬,以免造成失誤。利用回歸方程對經(jīng)濟現(xiàn)象進行分析,最后得到的經(jīng)濟變量之間的數(shù)量關系是一種統(tǒng)計關系,要使我們所得到的這種關系具有真實性、可靠性,排除偶然性,一定要注意對具體問題分析,并注意對經(jīng)濟現(xiàn)象的觀察必須是大量的。
(四)要考慮社會經(jīng)濟現(xiàn)象的復雜性
社會經(jīng)濟現(xiàn)象之間的關系比較自然技術現(xiàn)象之間的關系復雜得多。影響社會經(jīng)濟現(xiàn)象之間關系的不僅有自然技術因素,而且有政治的,經(jīng)濟的,道德的甚至心理的因素等等。而且社會條件的變化比較多和比較快,因此,在推廣應用是要注意社會經(jīng)濟現(xiàn)象的復雜性。
(五)對回歸模型中計算出來的參數(shù)的有效性應進行檢驗
在回歸分析中對回歸模型計算出來的參數(shù)(包括常數(shù)項及回歸系數(shù))的有效性應進行顯著性檢驗,以判斷回歸預測的有效性。經(jīng)過檢驗,如發(fā)現(xiàn)某回歸系數(shù)的數(shù)值沒有顯著意義,或某些自變量間存在著多重共線性,則具有這種情況的自變量應從回歸方程中剔除出去,以保證回歸預測的有效性。