
最近大家都很忙,忙著制定年度計(jì)劃。
制定年度計(jì)劃是在做 甚么?是在向未來要業(yè)績(jī)。
如何要得來業(yè)績(jī)?得先分析市場(chǎng)。
如何分析市場(chǎng)?免不了要調(diào)研。
如何調(diào)研?繞不開樣本量。
那今天就和大家聊一聊:如何確定樣本量?
一、根據(jù)允許的抽樣誤差的范圍確定樣本量
什么是抽樣誤差呢?抽樣誤差與樣本量之間存在什么關(guān)系?
先說抽樣誤差。假設(shè)你是互聯(lián)網(wǎng)公司的分析師,你想研究網(wǎng)民的偏好,所有的網(wǎng)民就構(gòu)成了總體,他們是你最終想了解的對(duì)象。但是,你有足夠的精力調(diào)查所有的網(wǎng)民嗎?沒有,你只能調(diào)查一部分,這一部分就是樣本。樣本能代表總體嗎?那要看兩者之間的差異,這個(gè)差異就叫做抽樣誤差。當(dāng)然,你肯定希望抽樣誤差越小越好。
那么,抽樣誤差和樣本量之間又是什么關(guān)系呢?你想啊,之所以會(huì)存在抽樣誤差,是因?yàn)槟阒徽{(diào)查了總體中的一部分樣本,樣本所包含的個(gè)體越少,則抽樣誤差越大。樣本所包含的個(gè)體就是樣本量,所以,樣本量和抽樣誤差是反向的。若描述得更確切些,公式就出來了:在簡(jiǎn)單隨機(jī)抽樣中,樣本量N與抽樣誤差△的關(guān)系見下面的公式:
其中:
α為顯著性水平,1-α為置信度。置信度是指當(dāng)以樣本估計(jì)總體時(shí),能夠正確估計(jì)的概率的大小。例如,當(dāng)置信水平為95%的時(shí)候,表示正確估計(jì)的概率是95%。
Zα/2是正態(tài)分布條件下與置信水平相聯(lián)系的系數(shù),置信水平取95%,則Zα/2=1.96。
P表示總體的百分比,雖然總體百分比P未知,但容易看出當(dāng)P=0.5時(shí),N取最大值
因此,公式里未知的只有抽樣誤差△和樣本量N。他們的反向關(guān)系,在這個(gè)公式中淋漓盡致地體現(xiàn)出來了。
當(dāng)然,你希望抽樣誤差越小越好,這樣精度高呀,但是,這要付出代價(jià)。代價(jià)就是要支付更多的調(diào)研經(jīng)費(fèi)。因此,確定樣本量的工作,實(shí)際上是在找到一個(gè)精度和經(jīng)濟(jì)的平衡點(diǎn),即目前的調(diào)研經(jīng)費(fèi)可支持多大范圍的抽樣誤差,你是否允許這個(gè)抽樣誤差。
原理和公式說完了,我們看具體操作步驟:
步驟一:設(shè)置α、p和△的值
設(shè)(1-α)=95%、p=0.5,、△=9.8%、分別將它們輸入到EXCEL表中,如下圖所示。步驟二:計(jì)算累積機(jī)率值
在單元格B2中輸入“=50%+A2/2”, 計(jì)算出來的累積機(jī)率值為97.5%,如下圖所示
步驟三 選擇“NORMINV”函數(shù)
選定單元格C2,單擊菜單欄中的“插入> 函數(shù)”命令(2003版單擊“插入>函數(shù)”命令,2007版單擊“公式>其他函數(shù)>統(tǒng)計(jì)>插入函數(shù)”),打開下圖所示的“插入函數(shù)”對(duì)話框,在“或選擇類別”下拉列表中選擇“統(tǒng)計(jì)”,然后再“選擇函數(shù)”列表框中選擇“NORMINV”
步驟四:計(jì)算Z值
單擊“確定”按鈕,打開“函數(shù)參數(shù)”對(duì)話框,設(shè)置該函數(shù)的各個(gè)參數(shù)值后,單擊“確定”按鈕。
步驟五:計(jì)算樣本量
根據(jù)公式1,在單元格F2中輸入:=C2^2*D2*(1-D2)/E2^2,得到樣本量的計(jì)算結(jié)果為100。
二、根據(jù)特定目的確定樣本量
這個(gè)思路叫做特定目的法。其中最有名的是拇指定律。具體內(nèi)容如下:
1、樣本若分成不同的組,總樣本量要保證每組的樣本量都不能低于100個(gè);
2、當(dāng)每組樣本還需按不同的特性或配額劃分成更小的組時(shí),要保證每個(gè)小組的樣本量至少在20-50個(gè)之間
拇指定律常用于總體數(shù)量龐大且有配額要求的調(diào)研,比如大眾消費(fèi)品市場(chǎng)的研究。
例如,要調(diào)查某城市消費(fèi)者對(duì)某品牌香煙的態(tài)度,我們可以把受訪的消費(fèi)者分成重度吸煙者和輕度吸煙者兩組,如果重度吸煙者的人數(shù)少,約占所有香煙消費(fèi)者的10%,為了保證重度消費(fèi)者的樣本量不低于100人,用簡(jiǎn)單隨機(jī)抽樣法,則總樣本量就需要1000人。
如果將重度吸煙者再細(xì)分成收入高、中、低三檔,其中收入高的人數(shù)最少,只占總體人數(shù)的1%,按照拇指定律,要求該組樣本量不少于20人,那么總樣本量至少需2000人。
因此,這個(gè)品牌香煙的調(diào)查項(xiàng)目樣本量就應(yīng)該是2000人。
總之,確定樣本量要考慮樣本結(jié)構(gòu)、精度要求、調(diào)研經(jīng)費(fèi)以及總體特征易變性等因素。比如說,如果總體易變性強(qiáng),或者說是樣本之間的差異性大的時(shí)候,則需要適當(dāng)增加樣本量。
愛華網(wǎng)



