本文系根據(jù)國(guó)內(nèi)外文獻(xiàn)閱讀整理而成。
我們對(duì)樣本進(jìn)行研究,常常是為了推論到某個(gè)人群,推論的準(zhǔn)確性問題,即研究的真實(shí)性的問題。研究的真實(shí)性包括內(nèi)部真實(shí)性和外部真實(shí)性。內(nèi)部真實(shí)性是指從當(dāng)前的研究中得到的結(jié)果能夠能否正確地反映目標(biāo)人群(源人群、參考人群)的真實(shí)情況,外部真實(shí)性是指從當(dāng)前的研究結(jié)果能否準(zhǔn)確地推論到目標(biāo)人群以外的其他人。內(nèi)部真實(shí)性是外部真實(shí)性的先決條件,通常所說的真實(shí)性往往指的是內(nèi)部真實(shí)性。
任何研究的目的都是為了發(fā)現(xiàn)真相。廣義上講,任何一項(xiàng)流行病學(xué)研究都可以看作是一種測(cè)量,而測(cè)量就不可避免地導(dǎo)致偏離真相,即測(cè)量誤差。因此,流行病學(xué)研究設(shè)計(jì)的核心是如何精確測(cè)量,而流行病學(xué)研究設(shè)計(jì)的基本原則是如何盡量減少測(cè)量誤差。在流行病學(xué)中,威脅真實(shí)性,從而導(dǎo)致錯(cuò)誤結(jié)論的原因有哪些呢?Szklo和Nieto認(rèn)為,原因包括偏倚(選擇偏倚、信息偏倚)、混雜和機(jī)會(huì)的作用三個(gè)方面;而更多的學(xué)者則把混雜看作為偏倚的一個(gè)類型。
一般地講,誤差是真實(shí)值與研究結(jié)果(實(shí)際測(cè)量值)之差,是事物的某一特征或狀態(tài)的度量值偏離真值的部分。這一真實(shí)值可以是理論估計(jì)值、總體的實(shí)際測(cè)量結(jié)果、多個(gè)群體的平均水平或者是類似群體的參考值。對(duì)真實(shí)值的測(cè)量要倚賴于金標(biāo)準(zhǔn)。誤差包括隨機(jī)誤差和系統(tǒng)誤差。隨機(jī)誤差是由于抽樣過程產(chǎn)生的,而系統(tǒng)誤差則是由于在研究設(shè)計(jì)(研究的本身方法學(xué)問題、設(shè)計(jì)的缺陷問題)以及實(shí)施過程中的失誤所致。流行病學(xué)調(diào)查性性研究中的系統(tǒng)誤差又稱偏倚。
流行病學(xué)的研究對(duì)象實(shí)際上是樣本人群。因此,我們認(rèn)定,任何流行病學(xué)研究都存在抽樣誤差。因?yàn)橹灰橇餍胁W(xué)研究,不管是否提及抽樣,它的目的都是為了由樣本推論至總體。因此,即使研究對(duì)象是總體的全部人群,也意味著將外推至另一更大的總體。因此,統(tǒng)計(jì)學(xué)上所謂的“如果以研究個(gè)體的集合而不是樣本為研究對(duì)象,則不存在抽樣誤差”的說法顯然并不適用于流行病學(xué)研究。
一、隨機(jī)誤差
隨機(jī)誤差是流行病學(xué)研究中的精確度的問題。由于流行病學(xué)研究中難以避免隨機(jī)誤差,因此,精確度只是相對(duì)的。隨機(jī)誤差主要與個(gè)體間的變異程度、抽樣方法以及樣本大小有關(guān)。在流行病學(xué)中,常常主要是通過增加樣本量來減少隨機(jī)誤差。由于在統(tǒng)計(jì)學(xué)上,樣本大小的確定往往僅與研究設(shè)計(jì)、總體特征、檢驗(yàn)水準(zhǔn)以及把握度有關(guān),因此看起來,這似乎是個(gè)純統(tǒng)計(jì)學(xué)的問題。然而事實(shí)上,流行病學(xué)研究中樣本量的確定是一個(gè)精確度與成本的關(guān)系的問題。往往,成本越高,精確度越大;成本越低,精確度越小。而在研究成本一定,即樣本量一定的前提下,如何提高精確度呢?這實(shí)際上是一個(gè)研究效率的問題。即樣本量一定時(shí),如何獲取更多的信息。
是否可以通過匹配來提高研究效率呢?匹配可以增加信息量,但是相應(yīng)的也會(huì)增加研究成本。而且,匹配可能引入新的混雜,反而會(huì)在一定程度上降低研究效率。因此,可以通過兩種途徑來判斷:
(1)比較研究所獲的信息量與樣本大小的相對(duì)關(guān)系;
(2)比較研究所獲的信息量與成本大小的相對(duì)關(guān)系。
信息量和樣本的關(guān)系實(shí)際上是信息量和成本的關(guān)系,因此,在實(shí)際工作中,樣本量有時(shí)“顯得”不是那么重要了。
二、系統(tǒng)誤差
系統(tǒng)誤差是測(cè)量結(jié)果系統(tǒng)的偏離真實(shí)值。它是流行病學(xué)研究中的真實(shí)性的問題。通常把流行病學(xué)研究中的各種系統(tǒng)誤差稱為偏倚,是任何導(dǎo)致錯(cuò)誤估計(jì)的系統(tǒng)的過程。在描述性研究中,偏倚發(fā)生在測(cè)量疾?。ɑ虮┞叮┑陌l(fā)生時(shí);在分析性研究中,偏倚發(fā)生在測(cè)量暴露和疾病的關(guān)聯(lián)時(shí)。偏倚包括正偏倚和負(fù)偏倚;或者趨于無效假設(shè)(towardsthe null)、遠(yuǎn)離無效假設(shè)(away from the null)、顛倒(switchoverbias)。設(shè)真實(shí)值為OR、RR,研究值為OR*,RR*,則有:對(duì)正偏倚OR*>OR,RR*>RR;對(duì)負(fù)偏倚OR*<OR,RR*<RR。

偏倚包括三種類型:選擇偏倚、信息偏倚和混雜偏倚。下面將會(huì)詳細(xì)地介紹這三種偏倚。
愛華網(wǎng)



