人口學(xué)研究方法:規(guī)范與發(fā)展
認(rèn)識(shí)人口與計(jì)劃生育統(tǒng)計(jì)的特點(diǎn) 避免統(tǒng)計(jì)方法和數(shù)據(jù)的誤用
由于工作關(guān)系和職業(yè)習(xí)慣,筆者對(duì)各種各樣有關(guān)人口和計(jì)劃生育的工作報(bào)告、分析文章中的統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)比較關(guān)注,經(jīng)??梢园l(fā)現(xiàn)統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)被誤用的情況。本文通過一些實(shí)例,分析由于不了解人口和計(jì)劃生育的特點(diǎn)而造成統(tǒng)計(jì)方法和數(shù)據(jù)誤用的情況。
1 個(gè)案與群體
〔實(shí)例1〕某調(diào)查報(bào)告稱,某村2001年出生嬰兒10人,其中男嬰6人,女嬰4人,出生性別比高達(dá)150,嚴(yán)重失調(diào)。
〔實(shí)例2〕某鄉(xiāng)給某村下達(dá)人口計(jì)劃,其中一項(xiàng)指標(biāo)是計(jì)劃生育率,要求當(dāng)年的計(jì)劃生育率不低于95%,而該村一般每年出生不足20人。
〔實(shí)例3]某地計(jì)生委根據(jù)群眾舉報(bào),查出某縣一個(gè)超生5胎的情況,據(jù)此稱該縣超生問題嚴(yán)重。
〔實(shí)例4〕某縣總?cè)丝诓蛔?0萬(wàn)人,近年來(lái)在孕婦中推廣服用“福施福”。上級(jí)要求檢查服用“福施福”后,人口缺陷發(fā)生率是否逐年下降。還有不少地方把孕產(chǎn)婦死亡率是否逐年下降當(dāng)作生殖健康服務(wù)工作的考核內(nèi)容。
這幾個(gè)例子所出現(xiàn)的問題都是以個(gè)案或少量發(fā)生的情況,說明一個(gè)地方宏觀的情況。人口和計(jì)劃生育統(tǒng)計(jì)所分析的對(duì)象(人口)或事例具有群體性,這個(gè)群體是由每個(gè)個(gè)體的人或事件集合而成。每個(gè)個(gè)體是否發(fā)現(xiàn)這種現(xiàn)象是偶然的,作為表現(xiàn)群體規(guī)律的統(tǒng)計(jì)數(shù)據(jù),只有當(dāng)群體具有相當(dāng)?shù)囊?guī)模后才有意義。群體的規(guī)模太小,盡管對(duì)每個(gè)個(gè)體的統(tǒng)計(jì)是準(zhǔn)確的,指標(biāo)的計(jì)算也是正確的,但計(jì)算結(jié)果并不能客觀地反映群體的規(guī)律。
如實(shí)例1,一個(gè)村的出生人數(shù)僅為10人,計(jì)算的出生性別比要么是100(“絕對(duì)平衡”),要么就是男女比例嚴(yán)重失調(diào)。實(shí)例2中計(jì)劃生育率受出生總數(shù)的影響,要么計(jì)生率正好100%,只要有一個(gè)計(jì)劃外出生,計(jì)劃生育率就低于95%。例4涉及的出生缺陷發(fā)生率或孕產(chǎn)婦死亡率一般統(tǒng)計(jì)時(shí)均以10萬(wàn)作為分母,對(duì)于一個(gè)縣,每年出生幾千人或1萬(wàn)多人,即使按照出生缺陷、孕產(chǎn)婦死亡發(fā)生的平均水平,每年也只有幾例,偶然性很大,在統(tǒng)計(jì)數(shù)據(jù)上很難表現(xiàn)為逐年下降。至于例 3,以一個(gè)特例說明全縣的情況,更是欠妥。各種人口和計(jì)劃生育統(tǒng)計(jì)教材上并未說明各項(xiàng)統(tǒng)計(jì)指標(biāo)適用的人群至少要達(dá)到多少,但一般說來(lái)這些統(tǒng)計(jì)指標(biāo)絕大部分不能用于分析規(guī)模在幾百人到一千多人的村級(jí)情況,許多指標(biāo)在縣、鄉(xiāng)級(jí)使用也不太合適。多年來(lái)各級(jí)是通過報(bào)表收集人口和計(jì)劃生育統(tǒng)計(jì)數(shù)據(jù)。報(bào)表由上級(jí)制發(fā),基層單位按統(tǒng)一的口徑填報(bào)每個(gè)項(xiàng)目,然后逐級(jí)匯總、上報(bào)。這樣以來(lái),上、下級(jí)的報(bào)表式樣相同,只是數(shù)量大小有差別,于是,上級(jí)單位計(jì)算哪些指標(biāo),下級(jí)單位 “照葫蘆畫瓢”計(jì)算相同指標(biāo)。特別是實(shí)行人口與計(jì)劃生育目標(biāo)管理責(zé)任制后,各項(xiàng)工作任務(wù)和責(zé)任要逐級(jí)分解、落實(shí),相應(yīng)地,工作指標(biāo)也被層層分解,上一級(jí)控制的指標(biāo)(如出生率、計(jì)劃生育率)也被一直套用到基層單位。在這種情況下,群體性的要求很容易被忽視。
2 自然屬性與社會(huì)屬性
〔實(shí)例5〕1995年8月,在全國(guó)上半年人口形勢(shì)分析會(huì)上,某省計(jì)生委分析本省當(dāng)年上半年二孩出生數(shù)量比上一年同期減少的原因時(shí)稱,由于自當(dāng)年起全省廣泛推行“三結(jié)合”,許多群眾為了發(fā)家致富,主動(dòng)退出二孩指標(biāo),于是二孩出生明顯減少。筆者的同事立即對(duì)此理由提出了置疑:既然是主動(dòng)退出二孩指標(biāo)導(dǎo)致二孩出生減少,那么原來(lái)應(yīng)在1995年上半年生育二孩的婦女至少在1994年上半年就應(yīng)退出二孩指標(biāo),而那時(shí)候,該省并未開展計(jì)劃生育“三結(jié)合”;至于 1995年上半年開展“三結(jié)合”后退出的二孩指標(biāo),其二孩出生減少的效果應(yīng)在1996年以后才能表現(xiàn)出來(lái)。群眾退出二孩指標(biāo)與二孩出生數(shù)量的減少在時(shí)間上出現(xiàn)了“矛盾”。
〔實(shí)例6〕許多文章分析婦女受教育程度越高,生育的孩子越少。
這兩個(gè)例子說明分析人口出生數(shù)量的變化應(yīng)考慮人口的自然屬性和社會(huì)屬性。人口首先是生物意義上的人口,具有自然屬性,同時(shí),人口生活、存在于一定的社會(huì)環(huán)境中,具有社會(huì)屬性。人口現(xiàn)象的發(fā)生既受自然屬性的影響,也受社會(huì)屬性的影響。從根本上說,社會(huì)屬性對(duì)人口現(xiàn)象的影響和制約是有條件的、間接的。而自然屬性的影響和制約是無(wú)條件的、直接的。社會(huì)屬性的影響和制約常常要通過自然屬性來(lái)實(shí)現(xiàn)。在分析人口現(xiàn)象的時(shí)候,首先要解釋人口的自然屬性,然后再解釋社會(huì)屬性。就實(shí)例5而言,從婦女退出二孩指標(biāo)到二孩出生減少,至少間隔10個(gè)月,即婦女的懷孕期,無(wú)論推行“三結(jié)合”力度多大,婦女10個(gè)月的懷孕期不能縮短。退指標(biāo)的發(fā)生與出生數(shù)的減少在時(shí)間上不“同步”,至少要“滯后”一年。也就是說,1995年上半年因開展“三結(jié)合”婦女退出二孩生育指標(biāo)不會(huì)影響這個(gè)時(shí)期的二孩出生數(shù)量。關(guān)于實(shí)例6,一個(gè)人的受教育程度屬于社會(huì)屬性,婦女受教育水平提高,的確會(huì)影響其生育行為。然而,影響生育的自然因素,直接因素是避孕節(jié)育行為,具體地說,影響生育的生物因素包括推遲結(jié)婚(不發(fā)生性行為)、采取避孕措施和流產(chǎn)(終止妊娠)。婦女文化程度影響到上述生物因素發(fā)生變化(如文化程度高,能夠更好地掌握避孕知識(shí),可以提高避孕的有效性,減少懷孕的可能),并通過上述因素影響生育孩子的數(shù)量。直接講文化程度與孩子數(shù)量的關(guān)系,未免有些牽強(qiáng)。
3 定量與定性
〔實(shí)例7〕各地每年都要分析當(dāng)年的人口形勢(shì),將當(dāng)年的數(shù)據(jù)與上一年的數(shù)據(jù)進(jìn)行對(duì)比。許多分析報(bào)告在列舉了對(duì)比數(shù)據(jù)后得出結(jié)論:“今年的工作比上一年有明顯的進(jìn)步,取得了巨大的成績(jī),上了一個(gè)新臺(tái)階”。但如果我們仔細(xì)察看各項(xiàng)指標(biāo)的數(shù)量,發(fā)現(xiàn)變化并不大,如計(jì)劃生育率由88.5%上升到89%,出生率由15.4‰下降為14.9‰(這其中由于人口年齡結(jié)構(gòu)的變化也能導(dǎo)致出生率下降),多孩出生由165人減少為149人,多孩率由2.2%下降為2%等等。根據(jù)這些數(shù)據(jù)的變化,得出的定性結(jié)論應(yīng)當(dāng)是:“工作穩(wěn)步發(fā)展,人口增長(zhǎng)保持平穩(wěn)的態(tài)勢(shì)”。人口和計(jì)劃生育的統(tǒng)計(jì)分析主要是指對(duì)數(shù)據(jù)的分析,并由“定量”的描述引申到定性的判斷。如果忽視定性的分析,那么,所謂定量分析不過是數(shù)量變化的文字描述而已。把握好定性分析的關(guān)鍵在于,定性分析應(yīng)以定量分析為基礎(chǔ),即“定量”在前,“定性”在后。那種先“定性”,再計(jì)算數(shù)量變化的做法,違背了“定量”與“定性”的基本規(guī)律。這樣進(jìn)行的定量分析,只是給定性的結(jié)論加一些數(shù)量的點(diǎn)綴。
4 模糊和精確
〔實(shí)例8〕某地區(qū)的一份材料稱,根據(jù)20年來(lái)每年總和生育率的變化,推算本地區(qū)20年來(lái)少生了1831275人。
〔實(shí)例9〕某縣計(jì)生委利用農(nóng)村趕集日人口比較集中的機(jī)會(huì),出動(dòng)服務(wù)車,設(shè)置咨詢臺(tái),向群眾宣傳計(jì)劃生育知識(shí),提供咨詢服務(wù)。縣計(jì)生委的匯報(bào)材料稱,“一個(gè)月來(lái)在集日上接受宣傳、咨詢的群眾累計(jì)達(dá)到127328人次”。
乍一看,實(shí)例8和實(shí)例9中的人數(shù)和人次數(shù)的統(tǒng)計(jì)和計(jì)算十分認(rèn)真仔細(xì),數(shù)字如此精確,令人欽佩。但轉(zhuǎn)念一想,不免生疑:實(shí)例8中利用總和生育率計(jì)算少生人口,需要以年齡別生育率與分年齡婦女人數(shù)相乘計(jì)算出生人數(shù),一般來(lái)看,每個(gè)年齡組的計(jì)算結(jié)果都不會(huì)是整數(shù),只好四舍五入。每一年若干個(gè)年齡組累計(jì)下來(lái),個(gè)位數(shù)已經(jīng)含糊不清了。再把20年的少生人數(shù)累計(jì)起來(lái),怎么可能精確到個(gè)位數(shù)呢?況且20年間,該地區(qū)的人口并非處于“封閉狀態(tài)”,各年齡組人數(shù)因?yàn)槿丝谶w移而變化,也會(huì)影響到計(jì)算少生的數(shù)量。至于實(shí)例9,在一個(gè)開放的、人們頻繁走動(dòng)的集市上,如何判定哪個(gè)人接受了宣傳,哪個(gè)人接受了咨詢,并沒有一個(gè)客觀的標(biāo)準(zhǔn);即使有標(biāo)準(zhǔn),實(shí)際操作中也很難把握,因此,根本沒有可能逐人統(tǒng)計(jì)。實(shí)例8、實(shí)例9中看似精確的數(shù)據(jù)令人感到滑稽,倒不如模糊一些,說“20年大約少生了18萬(wàn)人”,“一個(gè)月在集市上接受了計(jì)劃生育宣傳、咨詢服務(wù)的人次達(dá)10余萬(wàn)”,或許有幾分可信。從某種意義上講,人口和計(jì)劃生育所涉及的是宏觀層面的事情,與此相應(yīng)的統(tǒng)計(jì)數(shù)據(jù)所反映的是大致的狀態(tài)或趨勢(shì),沒有必要也沒有可能做到精確。許多同志在應(yīng)用統(tǒng)計(jì)方法時(shí),往往注意的是方法本身的定義和計(jì)算過程,而對(duì)計(jì)算中數(shù)據(jù)的來(lái)源不了解。人口和計(jì)劃生育統(tǒng)計(jì)屬于社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)范疇,很多數(shù)據(jù)是通過抽樣調(diào)查獲得,允許有一定的誤差;即使是全面的調(diào)查(如人口普查、全局報(bào)表),在實(shí)施過程中,也會(huì)遇到這樣、那樣的干擾或影響,存在著調(diào)查誤差,這是無(wú)法完全避免的。從某種意義上講,數(shù)據(jù)存在一定的誤差,這是人口和計(jì)劃生育統(tǒng)計(jì)的特點(diǎn)之一。
5 原因與結(jié)果
〔實(shí)例10〕最典型的例子莫過于“人口出生率每降低1個(gè)千分點(diǎn),人均GDP提高多少個(gè)百分點(diǎn)”的說法。這種說法的依據(jù)是利用相關(guān)分析法對(duì)全國(guó)各省的人口出生率和人均GDP的數(shù)量變化進(jìn)行計(jì)算,得出二者之間的函數(shù)關(guān)系式和相關(guān)系數(shù)。把人口出生率作為自變量,看自變量的單位變化影響因變量(人均GDP)變化的數(shù)量大小。
在這個(gè)例子中相關(guān)分析法本身以及有關(guān)的數(shù)據(jù)都是正確的,然而,用這樣一個(gè)函數(shù)式來(lái)解釋人口增長(zhǎng)與經(jīng)濟(jì)增長(zhǎng)的相互關(guān)系是有問題的。其一,就統(tǒng)計(jì)方法來(lái)說,相關(guān)分析只反映變量之間的相關(guān)關(guān)系,而不說明因果關(guān)系;其二,人口增長(zhǎng)與經(jīng)濟(jì)增長(zhǎng)固然相互影響,但從本質(zhì)上來(lái)說,是經(jīng)濟(jì)發(fā)展影響人們的思想,進(jìn)而影響人們的生育行為,最終導(dǎo)致生育率下降,人口增長(zhǎng)率降低,即經(jīng)濟(jì)增長(zhǎng)是“因”,而人口增長(zhǎng)是“果”。顛倒了因果關(guān)系,不僅邏輯上講不通,數(shù)量上的“相關(guān)性”也失去了意義。
筆者在多年的工作中體會(huì)到,由于人口和計(jì)劃生育所具有的特點(diǎn),人口和計(jì)劃生育統(tǒng)計(jì)分析方法的應(yīng)用和統(tǒng)計(jì)數(shù)據(jù)的解釋有別于其它部門和領(lǐng)域?qū)τ诮y(tǒng)計(jì)的一般要求。正確地應(yīng)用統(tǒng)計(jì)分析有助于我們認(rèn)識(shí)人口和計(jì)劃生育的特點(diǎn)和規(guī)律,只有科學(xué)地認(rèn)識(shí)和把握人口和計(jì)劃生育的特點(diǎn)和規(guī)律,才能避免在統(tǒng)計(jì)分析中陷入誤區(qū)。
社會(huì)科學(xué)實(shí)證研究中的統(tǒng)計(jì)分析方法應(yīng)用
鄭真真?。ū本┐髮W(xué)人口研究所 副教授)
統(tǒng)計(jì)學(xué)的應(yīng)用隨著微型計(jì)算機(jī)的普及越來(lái)越廣泛,在社會(huì)科學(xué)實(shí)證研究中幾乎是無(wú)處不在。有了一定規(guī)模的數(shù)據(jù)和一個(gè)統(tǒng)計(jì)分析軟件,就可以很方便地進(jìn)行各種估算和分析。然而由于統(tǒng)計(jì)分析方法本身并不像加減乘除那樣簡(jiǎn)單,而一些統(tǒng)計(jì)分析軟件已經(jīng)發(fā)展到幾乎是人人都可使用的程度,如果使用者在只知其然不知其所以然的情況下操作并得到結(jié)果,可能出現(xiàn)對(duì)統(tǒng)計(jì)分析方法誤用或?yàn)E用的現(xiàn)象。本文僅對(duì)一些統(tǒng)計(jì)分析中比較常見的問題進(jìn)行討論,以引起各方面的重視。
1 描述性統(tǒng)計(jì)
描述性統(tǒng)計(jì)是社會(huì)科學(xué)實(shí)證研究中最常用的方法。準(zhǔn)確、全面、正確的描述是所有實(shí)證分析的基礎(chǔ),如果對(duì)某個(gè)事件或某種現(xiàn)象的描述不清楚或存在偏差,那么其后的所有分析都將是值得懷疑的。一項(xiàng)研究能夠?qū)⑺芯康默F(xiàn)象或?qū)ο竺枋銮宄?,就是一個(gè)極大的貢獻(xiàn);而描述的偏差可能會(huì)引起公眾或?qū)W術(shù)界對(duì)某些社會(huì)現(xiàn)象的誤解,甚至誤導(dǎo)政府決策。但是因?yàn)槊枋鲂越y(tǒng)計(jì)所用方法簡(jiǎn)單易得,往往沒有得到足夠的重視。
均值的局限 普遍用于描述樣本集中趨勢(shì)的測(cè)量之一是均值。它對(duì)于近似正態(tài)的對(duì)稱分布樣本來(lái)說是比較好的測(cè)量,對(duì)于不對(duì)稱分布則不然,尤其會(huì)受到極端值的影響。兩個(gè)分布完全不同的樣本可能會(huì)有相同的均值,因此均值在某種程度上抹殺了樣本內(nèi)部的差異,而往往這種內(nèi)部差異正是需要我們進(jìn)行深入研究的、或應(yīng)當(dāng)引起人們注意的。為了彌補(bǔ)均值的這個(gè)缺陷,一般在報(bào)告均值的同時(shí)也報(bào)告方差,或用直方圖/散點(diǎn)圖的形式描述分布,以提請(qǐng)讀者注意群體內(nèi)部的差異。
不同群體的可比性 在描述性統(tǒng)計(jì)中,往往涉及到對(duì)不同時(shí)期或不同人群的總體描述,以反映社會(huì)變化或地區(qū)差異。在社會(huì)科學(xué)中、尤其是人口研究中,不少事件的發(fā)生都是與年齡密切相關(guān)的,如我國(guó)婦女大部分在35歲以前完成了生育,從而導(dǎo)致35歲以上育齡婦女中極高的避孕現(xiàn)用率。在這種情況下,兩個(gè)樣本之間存在避孕現(xiàn)用率的差異可能只是年齡結(jié)構(gòu)的差異,而不是年齡別避孕現(xiàn)用率的差異。又如在報(bào)告流動(dòng)人口犯罪問題時(shí),給人的印象往往是流動(dòng)人口犯罪率高于常住人口,但忽視了流動(dòng)人口的年齡和性別構(gòu)成與常住人口完全不同,且青年男性是犯罪率較高的人群。這種對(duì)兩個(gè)不同群體的比較往往會(huì)導(dǎo)致錯(cuò)誤的結(jié)論。
絕對(duì)數(shù)的使用 由于中國(guó)人口數(shù)量巨大,調(diào)查研究也比較容易得到大容量的樣本,所以對(duì)任何小概率事件用絕對(duì)數(shù)報(bào)告都會(huì)出現(xiàn)驚人的巨大數(shù)字,單純對(duì)絕對(duì)數(shù)的強(qiáng)調(diào)往往會(huì)產(chǎn)生戲劇性的效果。比較合理的方式一般是在報(bào)告某事件絕對(duì)數(shù)的同時(shí),給出該事件的發(fā)生率或占研究人群的比例。
小樣本的代表性 在一次抽樣的小樣本中求得的率或比例會(huì)非常不穩(wěn)定,與另一次抽樣的結(jié)果可能會(huì)有較大差距。因此當(dāng)研究?jī)H限于從小樣本獲得的資料時(shí),應(yīng)當(dāng)在報(bào)告比例的同時(shí)也報(bào)告樣本量。
2 雙變量統(tǒng)計(jì)分析
在社會(huì)科學(xué)研究中,首先分析的往往是兩個(gè)變量之間的關(guān)系,如用相關(guān)或列聯(lián)表等方法。一般在確定兩個(gè)變量之間確實(shí)有某種關(guān)系,如在經(jīng)過統(tǒng)計(jì)檢驗(yàn)后證實(shí)兩變量有顯著相關(guān)關(guān)系,進(jìn)行更進(jìn)一步的分析才有意義。因此,雙變量統(tǒng)計(jì)分析在實(shí)證分析中占有重要地位。但是,由于在應(yīng)用中對(duì)有些問題的忽視,雙變量統(tǒng)計(jì)分析也很容易出現(xiàn)偏差或錯(cuò)誤。
卡方檢驗(yàn)的局限 在利用列聯(lián)表對(duì)兩個(gè)定序/定類變量進(jìn)行相關(guān)分析時(shí),需要進(jìn)行統(tǒng)計(jì)檢驗(yàn)來(lái)判斷兩個(gè)變量的相關(guān)是否有統(tǒng)計(jì)上的顯著意義。不少研究結(jié)果都用卡方檢驗(yàn)的顯著性報(bào)告相關(guān)狀況。但值得注意的是,卡方統(tǒng)計(jì)量的計(jì)算本身是有局限性的,樣本越大,卡方值就會(huì)相應(yīng)增大,因此大樣本的卡方檢驗(yàn)很容易得到顯著結(jié)果。所以一般在報(bào)告卡方檢驗(yàn)結(jié)果以說明兩變量是否顯著相關(guān)時(shí),還應(yīng)當(dāng)同時(shí)報(bào)告相關(guān)強(qiáng)度,即相應(yīng)的相關(guān)系數(shù),如 Gamma,Lambda等。
統(tǒng)計(jì)意義上的顯著與差別的實(shí)際意義 在檢驗(yàn)兩個(gè)定距變量的均值差別是否具有統(tǒng)計(jì)上的顯著性時(shí),也存在相似的問題。由于樣本量越大,樣本均值分布的方差就越小,因此常用的t檢驗(yàn)結(jié)果就越可能顯著,任何細(xì)微的差別都可能有統(tǒng)計(jì)上的顯著性。但有時(shí)具有統(tǒng)計(jì)意義顯著性的差異,在實(shí)際生活中可能意義并不大,如同在兩個(gè)草堆之間找出一根草的差距,對(duì)判斷兩個(gè)草堆的大小沒有實(shí)際意義。因此,對(duì)任何檢驗(yàn)結(jié)果都應(yīng)當(dāng)有符合實(shí)際的解釋和說明。
虛假相關(guān)問題 雙變量分析中的虛假相關(guān)問題,幾乎在所有關(guān)于社會(huì)科學(xué)研究方法的教科書中都會(huì)涉及到,在統(tǒng)計(jì)分析方法的教學(xué)中也被視為經(jīng)典問題。但是多少年來(lái),人們?nèi)匀辉诓粩嗟刂貜?fù)著這個(gè)“經(jīng)典的錯(cuò)誤”,即認(rèn)為可見的或統(tǒng)計(jì)檢驗(yàn)結(jié)果顯著的相關(guān)就是真正的相關(guān);更為大膽的做法是把這種相關(guān)關(guān)系推向因果關(guān)系。我們知道,對(duì)于有的變量來(lái)說,即使是經(jīng)過檢驗(yàn)判定兩者具有統(tǒng)計(jì)上顯著的相關(guān)關(guān)系,也不一定存在實(shí)際意義上的關(guān)系,因?yàn)榭赡苡形纯紤]到的變量或不可測(cè)量的變量在同時(shí)對(duì)兩個(gè)研究變量起作用,有時(shí)甚至可能完全是偶然的巧合。例如,火災(zāi)的大小是以火災(zāi)損失來(lái)衡量的,而參加滅火的消防員人數(shù)是與火災(zāi)大小有關(guān)的,火災(zāi)越大,出動(dòng)的消防員就越多,但凡是具有常識(shí)的人都不會(huì)根據(jù)出動(dòng)消防員人數(shù)和火災(zāi)損失兩個(gè)變量之間的高度相關(guān),斷定出動(dòng)消防員越多火災(zāi)損失就越大,因?yàn)榛馂?zāi)的規(guī)模是決定因素(但很難直接衡量)。在有關(guān)人口科學(xué)研究中也有報(bào)告虛假相關(guān)的現(xiàn)象,如人口增長(zhǎng)率的降低導(dǎo)致了經(jīng)濟(jì)增長(zhǎng)的提法就是一例。因此,在分析相關(guān)關(guān)系時(shí),應(yīng)當(dāng)根據(jù)理論、知識(shí)、經(jīng)驗(yàn)、甚至常識(shí)來(lái)判斷這種分析是否有意義、是否存在其他變量的作用(稱為外在變量),避免得出有悖于常理的分析結(jié)果。有些虛假相關(guān)是可以通過統(tǒng)計(jì)分析方法判別的,如在控制了另外一些變量后觀察兩個(gè)變量的偏相關(guān),或在雙變量分析的基礎(chǔ)上,進(jìn)一步用多變量分析深入研究。
3 多變量分析
回歸分析是多變量分析中應(yīng)用最多的方法,尤其是邏輯斯蒂回歸更是被廣泛地應(yīng)用。在眾多應(yīng)用中,比較明顯的問題是使用方法是否得當(dāng)和對(duì)結(jié)果的報(bào)告和解釋是否規(guī)范、合理(見2002年第2期《人口研究》劉金塘文)。此外還有一些應(yīng)當(dāng)引起注意的問題。
分析框架的重要性 在社會(huì)科學(xué)研究中,各變量之間往往存在錯(cuò)綜復(fù)雜的關(guān)系,如果在進(jìn)行回歸分析之前沒有一個(gè)清晰合理的分析框架,那么回歸的結(jié)果有可能會(huì)引起質(zhì)疑。一般應(yīng)在報(bào)告回歸分析結(jié)果之前,介紹該分析的框架,如各變量的定義、各自變量與因變量的假設(shè)關(guān)系及其理由等,對(duì)建立的回歸模型做出合理性論證。有一些變量可能是作為控制變量納入回歸模型的,如性別、年齡等,最好事先解釋清楚。對(duì)假設(shè)因果關(guān)系的模型,應(yīng)當(dāng)至少能夠說明:(1)該因果關(guān)系在理論上是正確的、在實(shí)踐中是合理的;(2)從事件發(fā)生的時(shí)間上來(lái)說,應(yīng)當(dāng)是原因發(fā)生在先、結(jié)果發(fā)生在后。如有些回歸分析中,未加說明即把所有與因變量顯著相關(guān)的變量都囊括在自變量中,甚至有些自變量與因變量有明顯的互為因果關(guān)系,顯得分析邏輯混亂;還有的論文在簡(jiǎn)單介紹研究背景和數(shù)據(jù)來(lái)源之后,急于建立因果關(guān)系并推出回歸分析結(jié)果,然后再根據(jù)各變量在回歸模型中的顯著性一一說明,這相當(dāng)于事后解釋;這些做法都是錯(cuò)誤的。
在具備“奔4”微機(jī)和較易操作的軟件的今天,轉(zhuǎn)瞬間就可完成一次回歸分析,但是在此之前,需要有大量的前期準(zhǔn)備工作,包括文獻(xiàn)檢索和理論框架構(gòu)建,才能確保統(tǒng)計(jì)分析的科學(xué)性。
分析方法應(yīng)用的條件 每種多變量方法都有各自的前提條件或假設(shè),如果這些條件不具備或者假設(shè)不成立,該方法的應(yīng)用就成問題。如Pearson相關(guān)是考察線性相關(guān)關(guān)系,多元方差分析只能辨別線性相關(guān)因變量的多元差異,線性回歸分析假設(shè)自變量與因變量之間為線性關(guān)系,因子分析方法也是建立在各變量具有一定的線性相關(guān)基礎(chǔ)之上的;另外,在邏輯斯蒂回歸中,每個(gè)分類都應(yīng)保證有足夠的頻數(shù),如果頻數(shù)太少就會(huì)影響參數(shù)估計(jì)的穩(wěn)定性;等等。盡管一般不在報(bào)告分析結(jié)果時(shí)說明各種假設(shè)是否成立或條件是否滿足,但是在進(jìn)行分析時(shí)應(yīng)當(dāng)自覺地進(jìn)行考察。如果不能滿足條件或假設(shè)不能成立,就對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換或調(diào)整后再分析,或者改變分析方法。
多變量分析結(jié)果的展示和解釋 多變量分析的結(jié)果一般是通過列表來(lái)展示的?,F(xiàn)在一種并不少見的做法是直接把統(tǒng)計(jì)軟件的輸出直接復(fù)制到論文中,我們往往會(huì)在文章中看到包括回歸參數(shù)估計(jì)、參數(shù)標(biāo)準(zhǔn)差、檢驗(yàn)統(tǒng)計(jì)值、檢驗(yàn)顯著性、偏相關(guān)系數(shù)等等n行m列的大表,使人有目不暇接的感覺。實(shí)際上參數(shù)標(biāo)準(zhǔn)差和檢驗(yàn)統(tǒng)計(jì)值是提供給分析者的信息,沒有必要列在結(jié)果中;如果不是有特別需要的話,偏相關(guān)系數(shù)也不是關(guān)注重點(diǎn);最主要的應(yīng)當(dāng)是回歸參數(shù)估計(jì)及其顯著性。
在列出分析結(jié)果之后,應(yīng)當(dāng)對(duì)結(jié)果的實(shí)際意義進(jìn)行解釋和討論,而不是復(fù)述分析結(jié)果的數(shù)學(xué)意義。此外,在多元統(tǒng)計(jì)分析中一個(gè)常見的問題是分析者對(duì)變量作用不具有預(yù)期統(tǒng)計(jì)顯著性的失望,因此繞開不顯著的變量,甚至對(duì)數(shù)據(jù)或模型進(jìn)行各種調(diào)整以獲得顯著結(jié)果。其實(shí),統(tǒng)計(jì)分析結(jié)果不顯著往往也是有實(shí)際意義的。例如在分析我國(guó)高齡老人的地區(qū)分布時(shí)發(fā)現(xiàn),高齡老人比例與當(dāng)?shù)蒯t(yī)療衛(wèi)生指標(biāo)沒有顯著關(guān)系,這說明我國(guó)醫(yī)療系統(tǒng)還沒有具備延長(zhǎng)老人壽命的功能;另一方面也說明這些高齡老人的存活不是主要靠醫(yī)藥維持的。所以,在解釋分析結(jié)果時(shí),只要是在分析框架中涉及并參與分析的變量,無(wú)論作用顯著與否,都應(yīng)當(dāng)給予充分的討論;對(duì)于那些由于知識(shí)或信息的限制難以下結(jié)論的結(jié)果,可以作為問題提出,以便進(jìn)行更有針對(duì)性的進(jìn)一步研究。
此外,任何方法都有其局限性,分析結(jié)果也不會(huì)十分完美。因此在討論結(jié)果的同時(shí),也應(yīng)當(dāng)就此向讀者說明。例如當(dāng)一個(gè)多元線性回歸分析的確定系數(shù)較低時(shí),需要指出該模型有限的解釋能力,探討可能存在但沒有納入分析的更重要的影響因素。
不必求最新、只求最合適 有些研究生在撰寫學(xué)位論文時(shí),常常因?yàn)樽约簺]有應(yīng)用最新的統(tǒng)計(jì)分析方法而感到忐忑不安;在評(píng)論某項(xiàng)研究的創(chuàng)新性時(shí),有時(shí)也出現(xiàn)把學(xué)術(shù)創(chuàng)新和應(yīng)用新方法混為一談的現(xiàn)象,例如認(rèn)為應(yīng)用描述性統(tǒng)計(jì)方法的研究水平低于應(yīng)用解釋性或預(yù)測(cè)性方法的研究。新方法是層出不窮的。但是,出現(xiàn)了新方法并不意味著傳統(tǒng)方法就不再適用,而是各有千秋。統(tǒng)計(jì)分析方法是工具,哪件合適就用哪件,能用錘子解決的問題不必開沖床。有時(shí)越是復(fù)雜的方法,假設(shè)條件也會(huì)相應(yīng)較多,應(yīng)用的局限性更大。因此,盲目追求方法的新穎并不是高水平研究的保證,真正需要注意的是使用最合適的方法。而對(duì)所用方法的真正了解,是正確運(yùn)用統(tǒng)計(jì)分析方法的前提。
總和生育率的內(nèi)在缺陷及其改進(jìn)
郭志剛?。ū本┐髮W(xué)社會(huì)學(xué)系、北京大學(xué)中國(guó)社會(huì)與發(fā)展研究中心 教授)
1 總和生育率的應(yīng)用目的及評(píng)價(jià)原則
年齡別生育率及其概括性指標(biāo)總和生育率(TFR)是生育研究中最常用的指標(biāo)體系。但是現(xiàn)在它們面臨很多實(shí)際問題。本文不討論出生漏報(bào)導(dǎo)致統(tǒng)計(jì)失實(shí)的問題,因?yàn)槠湫再|(zhì)并不在于統(tǒng)計(jì)方法,而是一個(gè)社會(huì)問題。本文只局限于這一指標(biāo)體系內(nèi)在的有效性問題的方法論討論。一個(gè)指標(biāo)是否有效應(yīng)該以研究目的為標(biāo)準(zhǔn)來(lái)判斷,因此這一討論將結(jié)合當(dāng)前實(shí)際工作的需要來(lái)進(jìn)行。
統(tǒng)計(jì)指標(biāo)有兩種功能:一種是對(duì)調(diào)查對(duì)象本身特征的直接描述,另一種則用于推斷估計(jì)。很多情況下,統(tǒng)計(jì)指標(biāo)同時(shí)承擔(dān)著這兩種功能,比如樣本統(tǒng)計(jì)量反映了樣本對(duì)象的特征,同時(shí)又服務(wù)于推斷估計(jì)總體參數(shù)。既然是一種估計(jì),自然會(huì)有推斷偏差或誤差。評(píng)價(jià)不同估計(jì)的優(yōu)劣是看誰(shuí)的偏差或誤差更小。
那么通常我們應(yīng)用TFR到底要反映什么?一是為了在控制育齡婦女結(jié)構(gòu)的條件下概括時(shí)期生育水平,二是作為終身生育水平的估計(jì)。(注:在這一方面,總和生育率與人口的粗再生產(chǎn)率和凈再生產(chǎn)率的性質(zhì)類似,后兩個(gè)指標(biāo)中只不過又控制了下一代的性別和死亡因素的影響而已。)兩種性質(zhì)都反映在各年齡組生育率的合計(jì)上。通常,不同基數(shù)的相對(duì)數(shù)指標(biāo)不可以直接相加(注:如男性平均年齡加女性平均年齡沒有意義。)。為什么年齡別生育率可加,是因?yàn)樵O(shè)置了假設(shè)隊(duì)列的概念。 TFR主要不是平均的概念(注:早期將其翻譯為平均生育率的確是錯(cuò)誤的。至于年齡別生育率對(duì)婦女其他差別所做的均質(zhì)假設(shè),其實(shí)存在于所有匯總指標(biāo)之中,而不論其分組有多細(xì),但是都不會(huì)因此而稱為“平均××率”。),而是總和的概念(即假設(shè)隊(duì)列經(jīng)過所有年齡后生育總和)。因此,TFR一身兼兩任,其內(nèi)容為時(shí)期生育率總和,其形式為隊(duì)列終身生育水平。從前一種意義上使用時(shí)描述了該時(shí)期生育水平,從后一種意義上使用時(shí)則是假設(shè)隊(duì)列終身生育水平的估計(jì)(注:但這種估計(jì)從原理上不同于一般統(tǒng)計(jì)量從樣本推斷總體的情況,但有關(guān)評(píng)價(jià)原則卻是類似的。)。其值實(shí)際上涉及了35個(gè)實(shí)際隊(duì)列,并且只有在生育水平及年齡模式長(zhǎng)期不變的苛刻條件下,它才真正與實(shí)際隊(duì)列終身生育水平相吻合(但是隊(duì)列仍是泛指的)。盡管這一假設(shè)隊(duì)列與真實(shí)隊(duì)列并不能很好對(duì)應(yīng),但起碼可以及時(shí)提供一種隊(duì)列終身生育的估計(jì)來(lái)滿足實(shí)際需要。
2 缺陷一:總和生育率對(duì)終身生育水平的背離
表現(xiàn)A:最早對(duì)TFR的批評(píng)是由于其劇烈的時(shí)期波動(dòng)。一逢時(shí)期突發(fā)事件(如中國(guó)1958~1961),實(shí)際生育量發(fā)生了變化,TFR就會(huì)大幅度下降。應(yīng)該說,批評(píng)并不是指向其描述時(shí)期生育水平的功能,而是指向其作為終身生育估計(jì)的功能。因?yàn)?,這時(shí)TFR的下降只是由于時(shí)期特殊原因影響,并不意味著終身生育水平真的下降。實(shí)際上,時(shí)期效應(yīng)一過,TFR馬上便會(huì)出現(xiàn)反彈(即常說的生育補(bǔ)償),然而反彈的水平也并不能標(biāo)志終身生育水平真的那樣高??傊?,TFR短期內(nèi)劇烈波動(dòng)時(shí),將其作為終身生育率估計(jì)來(lái)理解很成問題。其中最引人注目的是,反彈年份的分孩次TFR(i)會(huì)超過1,特別是一孩TFR(1)會(huì)大大超過1(注:1982年全國(guó)1‰人口生育率抽樣調(diào)查數(shù)據(jù)顯示(姚新武,1995),1963年TFR=7.463,其中各孩次TFR都大于1,最高的是TFR(1)=1.568。作為隊(duì)列估計(jì),即是說每人生育一個(gè)半一孩,顯得很荒.唐。)。人口統(tǒng)計(jì)學(xué)對(duì)此采取的對(duì)策是,避免采用這些年份的TFR來(lái)作為終身生育水平的估計(jì),或者采用若干年份的TFR的平均值來(lái)作為終身生育水平的估計(jì),希望將欠年與盈年的誤差相抵消。
表現(xiàn)B:然而,有時(shí)即使社會(huì)中似乎并沒有什么特殊事件,TFR也會(huì)背離終身生育水平。但是,往往只是在TFR提高時(shí)才會(huì)受到一定關(guān)注(注:如1983年左右中國(guó)人口學(xué)界對(duì)TFR的討論。)。理論分析可以證明,這種背離既可以是正的,也可以是負(fù)的。特別是在負(fù)偏離的情況下,往往可能持續(xù)較長(zhǎng)的時(shí)間。并且,這種負(fù)背離實(shí)際上正是當(dāng)前所面臨的實(shí)際情況,因此特別需要重視。
這種背離產(chǎn)生的原因是婚育年齡的變化,或者說是隊(duì)列的年齡別生育模式的改變。而負(fù)偏離則對(duì)應(yīng)著婚育年齡的推遲。與時(shí)期突發(fā)事件對(duì)婚育年齡的推遲的暴發(fā)性影響不同,生育模式的自身轉(zhuǎn)變具有較長(zhǎng)時(shí)期的持續(xù)性、變化上的漸進(jìn)性、現(xiàn)象的隱蔽性等特征,并且它并不一定伴隨生育補(bǔ)償現(xiàn)象。甚至有時(shí)人們根本沒有意識(shí)到這種偏離的存在。
人口統(tǒng)計(jì)學(xué)早就揭示出,晚婚晚育可以延緩人口增長(zhǎng),但這是從長(zhǎng)期人口發(fā)展的角度來(lái)證明的。而晚婚晚育對(duì)年份TFR有什么影響,則很少有人涉及。從理論上說,取得同樣的終身生育總量,可以有不同的進(jìn)程表。即假定各隊(duì)列的終身生育數(shù)量不變,從某一時(shí)期開始各隊(duì)列的生育年齡開始推延,這一過程可以持續(xù)較長(zhǎng)一段時(shí)期,直至最終穩(wěn)定在一個(gè)新的生育模式上。我對(duì)此做過一些模擬計(jì)算,在這種情況下,生育模式轉(zhuǎn)變時(shí)期中每年的TFR一定會(huì)低于事先所設(shè)的隊(duì)列終身生育量,而這段時(shí)期兩端及以外各年份的TFR則可以等于事先所設(shè)的終身生育水平。這表明,即使將整個(gè)轉(zhuǎn)變過程或更長(zhǎng)時(shí)期中各年的TFR都加在一起平均,得到的還是—個(gè)偏低的終身生育估計(jì)。
更普遍的情況是生育模式的變化與終身生育量的變化同時(shí)發(fā)生,這時(shí)TFR下降同時(shí)受這兩個(gè)因素變化的影響,由生育模式變化導(dǎo)致TFR對(duì)終身生育水平的偏離便較難分析。
實(shí)際問題:實(shí)際工作需要不允許我們等很多年再提供真實(shí)隊(duì)列終身生育統(tǒng)計(jì),而現(xiàn)在只有TFR一種估計(jì)方法,并且我們知道TFR還會(huì)經(jīng)常偏離隊(duì)列終身生育水平,因此急需尋找一種更好的估計(jì)來(lái)取代它。否則盡管當(dāng)前TFR的值雖然很低,即使不論統(tǒng)計(jì)失真問題,我們也不知道這是否僅僅反映TFR發(fā)生了負(fù)偏離,那么我們憑什么肯定生育率已經(jīng)下降到更替水平了。我們又怎么能知道,當(dāng)生育年齡推遲告一段落時(shí),TFR向終身生育水平回歸時(shí)會(huì)回升多少。要知道更替水平的真正概念是實(shí)際上某隊(duì)列與其終身生育后代數(shù)量的比(注:從這個(gè)意義上,凈人口再生產(chǎn)率等于1僅是一種時(shí)期估計(jì)的標(biāo)準(zhǔn),并且也服從上述偏離,并不是真正的更替水平。)。
有關(guān)改進(jìn):Bongaarts和Feeney(1998)提出了去進(jìn)度效應(yīng)總和生育率(TFR')。該方法旨在提供一種根據(jù)時(shí)期數(shù)據(jù)對(duì)終身生育水平的較好估計(jì)(注:Bongaarts和Feeney(1998)警告說,這一方法不適用于那種特殊時(shí)期效應(yīng)(即重大災(zāi)害等)的年份。)。郭志剛(2001)對(duì)此進(jìn)行了介紹,并用中國(guó)多年生育數(shù)據(jù)對(duì)該方法進(jìn)行了檢測(cè)和評(píng)價(jià),結(jié)果是TFR'作為終身生育水平的估計(jì)的確大大優(yōu)于TFR(注:郭震威 (2000)認(rèn)為TFR'不倫不類,既不是時(shí)期生育指標(biāo),又不是終身生育指標(biāo),是個(gè)尷尬的指標(biāo)。我認(rèn)為,它只是應(yīng)實(shí)際需要而產(chǎn)生的另一種根據(jù)時(shí)期生育信息對(duì)終身生育水平的新估計(jì)而已,其實(shí)這沒有什么可尷尬的。統(tǒng)計(jì)中凡是不能直接測(cè)量的時(shí)候,都得采用估計(jì)來(lái)代替。真正有意義的問題是,它是否比傳統(tǒng)TFR更接近于終身生育水平。)。
該方法基本原理可以這樣來(lái)理解:現(xiàn)實(shí)中生育模式轉(zhuǎn)變時(shí),除了導(dǎo)致該年生育數(shù)量有所變化以外,還會(huì)有其他共生現(xiàn)象,如分孩次的平均生育年齡(MACi)也會(huì)變化(注:Bongaarts和Feeney(1998)強(qiáng)調(diào)要用分孩次的平均生育年齡,而不能用總的平均生育年齡,因?yàn)楹笳邥?huì)抹煞實(shí)際變化。)。MACi實(shí)際上是生育模式轉(zhuǎn)變的測(cè)量值,可以在理論上建立其變化量與時(shí)期生育變化量之間的函數(shù)關(guān)系。TFR'便是在常規(guī)分孩次TFR(i)的基礎(chǔ)上利用MACi的變化信息來(lái)調(diào)整,得到去進(jìn)度效應(yīng)的分孩次TFR'(i),然后再匯總為TFR'。經(jīng)過調(diào)整,TFR'可以在相當(dāng)程度上修正TFR距終身生育水平的偏離,因此TFR'更接近于隊(duì)列終身生育水平(這里隊(duì)列仍是泛指的)。也就是說,我們可以用TFR'來(lái)替代TFR原來(lái)所承擔(dān)的終身生育估計(jì)的功能,而TFR還可以繼續(xù)承擔(dān)描述時(shí)期生育水平的功能,TFR'與TFR之差可以作為生育推延對(duì)當(dāng)前生育水平影響的估計(jì)(注:我曾當(dāng)面請(qǐng)教Bongarts,問TFR'方法是否可應(yīng)用于預(yù)測(cè)模擬,他毫不猶豫地回答說不能。)。
我認(rèn)為,盡管TFR'指標(biāo)還有繼續(xù)改進(jìn)的余地(注:比如某一年的MACi的計(jì)算還要前一年和后一年的數(shù)據(jù),因而多少喪失了一點(diǎn)及時(shí)性。然而,我自己曾嘗試過另外的計(jì)算,比如只用前一年和當(dāng)年兩年的信息,調(diào)整的結(jié)果也并不差。),但顯然Bongarrts和Feeney為解決這一估計(jì)問題指出了極富于科學(xué)價(jià)值的方法論途徑。并且,這一新指標(biāo)不僅可以用于監(jiān)測(cè)隊(duì)列終身生育水平,也可以用于分析以往的生育數(shù)據(jù)(郭志剛,2000),幫助我們更好地理解我國(guó)的生育轉(zhuǎn)變史和計(jì)劃生育史。
3 缺陷二:總和生育率不能控制育齡婦女的孩次結(jié)構(gòu)
對(duì)某些重要因素進(jìn)行統(tǒng)計(jì)控制可以為不同年份或不同地區(qū)的比較提供更大的可比性。盡管TFR控制了育齡婦女的年齡結(jié)構(gòu),但是它并沒有控制育齡婦女的孩次結(jié)構(gòu)。然而,當(dāng)前許多人口模擬研究都不能再忽略育齡婦女的孩次結(jié)構(gòu)問題,否則會(huì)有損其研究結(jié)果的有效性(注:比如,與調(diào)整生育政策相聯(lián)系的人口模擬如果忽略現(xiàn)有一孩的婦女人數(shù),便無(wú)法計(jì)算由于多年積累在一孩的這批婦女在政策調(diào)整時(shí)將產(chǎn)生的特殊生育效應(yīng)。另外,有關(guān)生育政策后果方面的研究(如四二一家庭結(jié)構(gòu))也有類似問題。)。
問題的表現(xiàn):實(shí)際上生育過程是嚴(yán)格的遞進(jìn)事件,也就是說,只有未生育者才能生育一孩,只有生育過一孩且尚未生育二孩者才能生育二孩。而常規(guī)生育率則是以年齡別所有婦女總數(shù)作為基數(shù),因而沒有容納育齡婦女的曾生孩次信息,也就不能控制曾生孩次這種結(jié)構(gòu)影響。因此,比較孩次結(jié)構(gòu)差別較大的年份或地區(qū)之間的年齡別生育率(或TFR),便不能區(qū)分其差異到底是出于生育水平不同還是出于孩次結(jié)構(gòu)不同。當(dāng)其用于人口預(yù)測(cè)模擬時(shí),如果假定兩地區(qū)育齡婦女年齡結(jié)構(gòu)相同,同樣的系列生育率的假設(shè)會(huì)導(dǎo)致孩次結(jié)構(gòu)十分不同的地區(qū)(代表著不同生育政策類型)將會(huì)有相同的出生人數(shù),顯然這嚴(yán)重地偏離實(shí)際情況。因此,面對(duì)當(dāng)前的許多研究需要,基于年齡別生育率的TFR方法無(wú)論是用于比較分析上還是用于預(yù)測(cè)模擬,都會(huì)影響其結(jié)果的有效性(注:至于分孩次的年齡別生育率,只是對(duì)分子(即出生)劃分了孩次類別,但是并沒有對(duì)育齡婦女本身劃分孩次結(jié)構(gòu)。其基數(shù)沒有控制孩次結(jié)構(gòu),因而從本質(zhì)上說也沒有控制孩次結(jié)構(gòu)。)。
替代方法的產(chǎn)生:實(shí)際上,計(jì)劃生育采取了分類指導(dǎo)原則后,便產(chǎn)生了多種生育政策類型,其顯著特征便是孩次控制上的不同。在不同地區(qū)實(shí)施不同政策時(shí),育齡婦女的孩次結(jié)構(gòu)便取得了越來(lái)越重要的意義。從這一角度出發(fā),導(dǎo)致Feeney(1985)和馬瀛通等(1986)分別以不同思路創(chuàng)建了孩次遞進(jìn)生育指標(biāo)體系。
他們的共同點(diǎn)在于采用孩次遞進(jìn)比作為生育測(cè)量的基礎(chǔ)來(lái)構(gòu)建指標(biāo)體系。如前所述,每年的出生可以劃分孩次。如果再將某一群體生育指標(biāo)的基數(shù)由對(duì)應(yīng)口徑的年中婦女總數(shù)換成年初對(duì)應(yīng)(即前一)孩次婦女時(shí),便稱為孩次遞進(jìn)比(注:實(shí)際上可理解為一種概率,如本年年初某年齡組(或孩次間隔組)只有一孩的婦女中在本年生育二孩的比例。)。然后,還可以將孩次遞進(jìn)比換算成遞進(jìn)總和生育率。
Feeney的模型突出地考慮了孩次遞進(jìn)間隔因素,不考慮年齡結(jié)構(gòu),因而常被稱為間隔遞進(jìn)模型。而馬瀛通等的模型則突出地考慮了年齡遞進(jìn)因素,因此常被稱為年齡遞進(jìn)模型。
這兩種方法不僅可用于在控制婦女孩次結(jié)構(gòu)條件下的比較分析,也可以用于預(yù)測(cè)模擬(注:應(yīng)該指出,其實(shí)中國(guó)人民大學(xué)人口研究所的老一輩人口學(xué)家早在 1970年代所自行創(chuàng)建的標(biāo)準(zhǔn)(或可變)生育率預(yù)測(cè)法中也已經(jīng)包含了控制孩次結(jié)構(gòu)影響的思想(劉錚、鄔滄萍、查瑞傳,1981)。)。遞進(jìn)方法不僅可以在預(yù)測(cè)中控制孩次結(jié)構(gòu),而且應(yīng)用于模擬預(yù)測(cè)時(shí)實(shí)際上比常規(guī)生育率方法更方便(注:這里的方便指,它只需要每年期初婦女的孩次別人口數(shù)便可以直接乘以遞進(jìn)比便得到對(duì)應(yīng)的生育量,而不需要再計(jì)算其中婦女人數(shù)。)。由于遞進(jìn)比的概率性質(zhì),還能根本避免孩次別總和生育率出現(xiàn)的那種超過1的現(xiàn)象(注:盡管如此,Bongaats和Feeney(1998)認(rèn)為這一類應(yīng)用生命表方法的生育指標(biāo)仍然沒有真正控制生育進(jìn)程變化的影響。)。
主持人評(píng)論
本期論壇邀請(qǐng)的三位專家都有多年從事人口統(tǒng)計(jì)和數(shù)據(jù)分析的經(jīng)驗(yàn),對(duì)人口學(xué)研究方法有很深的造詣。王謙副司長(zhǎng)通過從多年工作中積累的大量實(shí)例,分析了在人口和計(jì)劃生育工作中經(jīng)常發(fā)生的統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)被誤用的情況;鄭真真副教授則對(duì)統(tǒng)計(jì)分析中比較常見的問題進(jìn)行丁獨(dú)到的分析和總結(jié);郭志剛教授對(duì)總和生育率指標(biāo)進(jìn)行了深入全面的剖析,分析了其內(nèi)在缺陷和改進(jìn)方法。
王謙副司長(zhǎng)通過10個(gè)典型實(shí)例說明在人口和計(jì)劃生育實(shí)際工作中,統(tǒng)計(jì)方法和統(tǒng)計(jì)數(shù)據(jù)在五個(gè)方面經(jīng)常被誤用。這五個(gè)方面的問題有些屬于統(tǒng)計(jì)分析中容易犯的錯(cuò)誤,帶有普遍性,如,錯(cuò)誤地解釋變量之間的因果關(guān)系,在統(tǒng)計(jì)分析中忽視定性分析與定量分析的關(guān)系,結(jié)論不是由統(tǒng)計(jì)分析中得出,使得定量分析只是定性結(jié)果的一種點(diǎn)綴。有些問題則由于人口與計(jì)劃生育領(lǐng)域的特點(diǎn)而顯得更為嚴(yán)重,如他指出的,大部分人口和計(jì)劃生育統(tǒng)計(jì)指標(biāo)在村一級(jí)或縣、鄉(xiāng)不適用是因?yàn)榭傮w規(guī)模不夠。統(tǒng)計(jì)所研究的是總體的數(shù)量關(guān)系而不是個(gè)別的數(shù)量關(guān)系,所以統(tǒng)計(jì)指標(biāo)在一定的總體規(guī)模下才有意義,這是統(tǒng)計(jì)學(xué)中的基本概念,但是在實(shí)際中卻經(jīng)常被誤用。我們經(jīng)??吹降腻e(cuò)誤都是統(tǒng)計(jì)學(xué)上的一些“基本概念錯(cuò)誤”,而不是“高深錯(cuò)誤”。統(tǒng)計(jì)學(xué)上的概念和方法可能很簡(jiǎn)單,也容易理解,但是要在實(shí)際工作中正確地、恰如其分地運(yùn)用并不容易,需要結(jié)合研究對(duì)象的特點(diǎn)。
鄭真真副教授從另一個(gè)角度對(duì)描述性統(tǒng)計(jì)、雙變量統(tǒng)計(jì)和多變量統(tǒng)計(jì)分析中經(jīng)常被忽視的問題進(jìn)行了討論和分析。她不僅指出了問題的所在,而且告訴大家應(yīng)該如何做,她所討論的內(nèi)容是大部分統(tǒng)計(jì)教科書上所沒有的,具有很大的實(shí)用性,對(duì)于正確地應(yīng)用統(tǒng)計(jì)分析方法具有很大的指導(dǎo)意義,具體的問題這里就沒有必要再評(píng)述了。她的分析源于多年教學(xué)和科研工作的總結(jié)和升華,很多觀點(diǎn)具有獨(dú)到性,如對(duì)描述性統(tǒng)計(jì)的重視,多變量分析結(jié)果的展示和解釋,不必求最新、只求最合適的方法。
王謙和鄭真真從不同角度對(duì)統(tǒng)計(jì)分析和統(tǒng)計(jì)數(shù)據(jù)應(yīng)用中出現(xiàn)的問題進(jìn)行了分析,郭志剛教授則對(duì)人口統(tǒng)計(jì)中的一個(gè)重要指標(biāo)-總和生育率進(jìn)行了深入分析。他指出指標(biāo)是否有效應(yīng)該以研究目的為標(biāo)準(zhǔn)來(lái)判斷,他從總和生育率對(duì)終身生育水平的背離和不能控制育齡婦女的孩次結(jié)構(gòu)這兩大缺陷出發(fā),對(duì)問題的表現(xiàn)形式、實(shí)際工作中的需求以及改進(jìn)方法進(jìn)行了分析和介紹,其中滲透了他自己近年來(lái)對(duì)這一問題的研究結(jié)果和體會(huì)。我看完他的文章覺得獲益匪淺,如90年代以來(lái)中國(guó)的人口調(diào)查所得到的總和生育率指標(biāo)都非常低,這里面有統(tǒng)計(jì)漏報(bào)的問題,也有總和生育率指標(biāo)自身的缺陷所帶來(lái)的問題,在婚育年齡推遲時(shí),總和生育率會(huì)低估終身生育水平。在以往的人口學(xué)研究中,對(duì)方法論的討論和重視是不夠的。研究方法的創(chuàng)新源于實(shí)踐的需求,面對(duì)21世紀(jì)更加錯(cuò)綜復(fù)雜的人口問題,我們需要研究方法的不斷創(chuàng)新與發(fā)展,這是目前我國(guó)人口科學(xué)發(fā)展面臨的一個(gè)巨大挑戰(zhàn)。
三位專家的分析和討論有很大的實(shí)用性,值得從事人口和計(jì)劃生育的實(shí)際工作者和學(xué)者認(rèn)真學(xué)習(xí),但是畢竟他們不可能把所有的問題都?xì)w納概括全面,這也不是本期論壇的初衷。我們希望通過本期論壇起到拋磚引玉的作用,引起同行對(duì)這一問題的重視。中國(guó)規(guī)范的人口學(xué)研究畢竟只有20多年的歷史,有問題是可以理解的,統(tǒng)計(jì)分析方法的誤用和研究的不規(guī)范在其他學(xué)科領(lǐng)域也同樣存在,甚至有可能更嚴(yán)重,但是我們不能漠視這種狀況繼續(xù)下去,問題的解決需要全體同仁的重視和努力。我覺得目前至少可以加強(qiáng)以下幾個(gè)方面的工作:
(1)提倡學(xué)術(shù)爭(zhēng)鳴,鼓勵(lì)同行之間開展批評(píng),這將有利于學(xué)科的發(fā)展與規(guī)范;
(2)編審人員把好質(zhì)量關(guān),使在雜志上發(fā)表的文章符合學(xué)術(shù)規(guī)范,雜志上文章的示范作用往往比教科書要大得多;
(3)加強(qiáng)統(tǒng)計(jì)分析方法的教學(xué)工作。強(qiáng)調(diào)方法的適用性和在實(shí)際應(yīng)用中應(yīng)該注意的問題。
【參考文獻(xiàn)】
1 劉錚,鄔滄萍,查瑞傳.人口統(tǒng)計(jì)學(xué).中國(guó)人民大學(xué)出版社,1981
2 馬瀛通,王彥祖,楊叔章.遞進(jìn)人口發(fā)展模型的提出與總和遞進(jìn)指標(biāo)體系的確立.人口與經(jīng)濟(jì),1986;1,2
3 姚新武.中國(guó)生育數(shù)據(jù)集.中國(guó)人口出版社,1995
4 郭震威.對(duì)“去進(jìn)度效應(yīng)總和生育率(TFR')方法”的一點(diǎn)看法.人口研究,2000;1
5 郭志剛.從近年來(lái)的時(shí)期生育行為看終身生育水平.人口研究,2001;1
6 郭志剛.時(shí)期生育水平指標(biāo)的回顧與分析.人口與經(jīng)濟(jì),2000;1
7 Feeney.1985.Parityprogressionprojection.InternationalUnionfortheScientific
StudyofPopulation,InternationalPopulationConference,Florence1985,vol.4
8 BongaartsandFeeney.1998.Onthequanturnandtempooffertility.Populationand
DevelopmentReview24(2):271~291/中譯文:人口研究,2000;1