欧美日韩在线一区,成人尤物,久久久久久久综合

知識(shí)共享

第5章樣本容量的確定

來源：默認(rèn)管理員點(diǎn)擊數(shù)：2116發(fā)布時(shí)間：2012-12-18

　　主要內(nèi)容：

　　l樣本容量確定的方法

　　l 正態(tài)分布及其評(píng)價(jià)

　　l理解總體、樣本和抽樣分布

　　l點(diǎn)估計(jì)與區(qū)間估計(jì)

　　l 抽樣平均數(shù)和抽樣比例

　　5.1 確定概率抽樣的樣本量

　　在確定概率抽樣樣本容量的過程中會(huì)遇到涉及財(cái)務(wù)、統(tǒng)計(jì)和管理三個(gè)方面的問題。一般原則是，樣本越大，抽樣誤差就越小。但樣本大，耗費(fèi)的成本也高，而且一個(gè)項(xiàng)目可支配資源畢竟是有限的。雖然抽樣成本隨著樣本容量的增加呈直線遞樣(樣本容量增加1倍，成本也增加1倍)。抽樣誤差卻只是以樣本量相對(duì)增長(zhǎng)速度的平方根遞減。即如果樣本量增加了3倍，數(shù)據(jù)搜集成本也增加了3倍，而抽樣誤差只降低了1/2。最后一點(diǎn)，樣本容量計(jì)算還反映了管理方法的問題。要求多高的估計(jì)精確度?實(shí)際總體值在所選定的置信區(qū)間內(nèi)的置信度是多少?正如你將在本章中學(xué)到的，有許多種可能性。有的情況要求精確度較高(抽樣誤差很小)，并且要求總體值在較小誤差范圍以內(nèi)的置信度較高。而有些情況則不要求這些。

　　5.2 確定樣本容量的方法

　　5.2.1 可支配預(yù)算

　　某一研究對(duì)象的樣本容量通常直接或間接地由可支配的預(yù)算額所決定。因此，順序上，樣本容量通常是稍后才確定的。一個(gè)品牌經(jīng)理如果有40000美元預(yù)算可用于某項(xiàng)市場(chǎng)研究，那么除去其他項(xiàng)目成本(如調(diào)查方案和問卷的設(shè)計(jì)、數(shù)據(jù)的處理、分析等)后，余下的那部分預(yù)算才決定著被調(diào)查的樣本容量的大小。如果可支配資金太少，可以確定的樣本量太小，就必須做出決策，是補(bǔ)充更多的資金還是放棄這一項(xiàng)目。

　　雖然這種方法看來缺乏科學(xué)性和過于武斷，但是在一個(gè)離不開財(cái)務(wù)資源預(yù)算編制的整體環(huán)境下它確實(shí)存在。財(cái)務(wù)上的限制要求調(diào)查人員的設(shè)計(jì)方案要利用有限的資源提供有利于決策的高品質(zhì)的數(shù)據(jù)資料。“可支配預(yù)算”方法使調(diào)研人員不得不尋求多種選擇的搜集方法并謹(jǐn)慎衡量信息的價(jià)值及其成本。

　　5.2.2 單憑經(jīng)驗(yàn)的做法

　　一些客戶會(huì)指定REPs(對(duì)計(jì)劃的具體要求)，他們會(huì)要求樣本容量為200、400、500或其他的特定量。這個(gè)數(shù)據(jù)的確定有時(shí)是出于對(duì)抽樣誤差的考慮，而有時(shí)則只是依據(jù)以往的經(jīng)驗(yàn)和過去進(jìn)行的相似調(diào)研中采用的樣本量。對(duì)指定樣本容量這種做法的全理解釋歸結(jié)起來只能說是“一種強(qiáng)烈的感覺”，認(rèn)為某一特定的樣本容量是必要的或適當(dāng)?shù)摹?/p>
　　也許有人認(rèn)為客戶指定的樣本容量有利于計(jì)劃調(diào)研目標(biāo)的實(shí)現(xiàn)。有些情況下，調(diào)研人員會(huì)認(rèn)為指定的樣本容量不符合要求。這時(shí)，調(diào)研人員有職責(zé)向客戶提出擴(kuò)大樣本容量的建議并讓客戶做出最后的決定。如果擴(kuò)大樣三容量的建議遭到了否決，調(diào)研人員會(huì)拒絕提交計(jì)劃，因?yàn)樗?她)認(rèn)為樣本容量不合要求會(huì)嚴(yán)重影響調(diào)研成果。

　　5.2.3 要分析的子群數(shù)

　　在任何確定樣本容量的問題中，都必須認(rèn)真考慮所要分析并要據(jù)此做統(tǒng)計(jì)推斷的總體樣本的各個(gè)子群的數(shù)目的預(yù)期容量。例如，從整體上看樣本容量為400很符合要求，但若要分別分析男性和女性被調(diào)查者，并且要求男性與女性的樣本各占一半，那么每個(gè)子群的容量?jī)H為200。這個(gè)數(shù)字是否符合要求，能使分析人員對(duì)兩組的特征做出預(yù)期的統(tǒng)計(jì)推斷呢?再如，要按年齡和性別分析調(diào)研結(jié)果，問題就變得更復(fù)雜了。假設(shè)要按以下方式將總體樣本劃分為四組：

　　l 35歲以下的男性

　　l35歲以上的男性

　　l35歲以下的女性

　　l 35歲以上的女性

　　如果預(yù)計(jì)每組約占總樣本的25%，那么子群容量?jī)H有100。這個(gè)數(shù)字能否使我們按照調(diào)研目標(biāo)的要求對(duì)各組分別做出統(tǒng)計(jì)推斷呢?隨著樣本量的縮小，抽樣誤差的增加，會(huì)出現(xiàn)這樣一個(gè)問題，那就是調(diào)查人員很難辨別依據(jù)現(xiàn)象所得的兩組間的差別(如表明打算購買新產(chǎn)品的百分比)是真正意義上的差別還只是由抽樣誤差引起的差別。

　　在其他條件相同的情況下，所要分析的子群數(shù)目越大，所需的總樣本容量也就越大。一般認(rèn)為樣本量要足夠大，以便每個(gè)主子群的容量至少為100，而每個(gè)次子群的容量至少也有20-50。

　　5.2.4 傳統(tǒng)的統(tǒng)計(jì)方法

　　你可能在其他書上見過確定簡(jiǎn)單隨機(jī)樣本的傳統(tǒng)方法。回顧一下這些方法。在利用抽樣結(jié)果做重要推斷時(shí)需要三條信息：

　　• 總體標(biāo)準(zhǔn)差的估計(jì)值

　　• 抽樣的允許誤差范圍

　　• 抽樣結(jié)果在實(shí)際總體值的特定范圍(抽樣結(jié)果±抽樣誤差)內(nèi)的預(yù)期置信度。

　　有了以上三條，就可以計(jì)算出簡(jiǎn)單隨機(jī)抽樣所需的樣本容量了。

　　5.3 正態(tài)分布

　　5.3.1 總體特征

　　在古典統(tǒng)計(jì)推斷中，正態(tài)分布居于特別重要的地位。這有以下幾面原因：首先，市場(chǎng)人員遇到的許多變量其概率分布都趨于正態(tài)分布。如，軟飲料包裝的數(shù)量;愛吃快餐的人平均每月吃快餐的次數(shù);每星期看電視的平均小時(shí)數(shù)。其次，有理論上的原因。比較重要的一條是大數(shù)定理、中心極限定理。根據(jù)該定理，對(duì)于任何總體，不論其分布如何，隨著樣本容量的增加，其抽樣平均數(shù)的分布趨于正態(tài)分布。這種趨向的重要性將在后面做詳細(xì)說明。再次，許多離散型概率的分布也近似于正態(tài)分布。例如，將大量的某地男性身高值標(biāo)在一張圖表上，就會(huì)得到如圖5-1的分布圖，這種分布就是正態(tài)分布，它有以下幾個(gè)重要的特征：

　　(1) 正態(tài)分布呈現(xiàn)鐘形且只有一個(gè)眾數(shù)。眾數(shù)代表著集中的趨勢(shì)，是發(fā)生頻率最高的那個(gè)特殊值。兩峰的(兩個(gè)眾數(shù))分布有兩個(gè)峰值;

　　(2) 正態(tài)分布關(guān)于其平均對(duì)稱。也就是說它是對(duì)稱的。它集中趨勢(shì)的三個(gè)衡量標(biāo)準(zhǔn)(平均數(shù)、中位數(shù)和眾數(shù))是相等的。

　　(3) 一個(gè)正態(tài)分布的特殊性由其平均數(shù)和標(biāo)準(zhǔn)差決定。

　　(4) 正態(tài)曲線下方面積等于1，表明它包括了所有的調(diào)查結(jié)果。

　　(5) 正態(tài)曲線下方在任意兩個(gè)變量值之間的面積，等于在這一范圍內(nèi)隨機(jī)抽取一個(gè)觀察對(duì)象的概率。以圖5.1為例，一次抽取到一名男性，其身高在172cm-177cm之間的概率為34.13%。

　　(6) 正態(tài)分布還有一個(gè)特點(diǎn)，就是所有的正態(tài)分布在平均數(shù)±1個(gè)標(biāo)準(zhǔn)差之間的面積相同，都占曲線下方面積的68.26%或者說是占全部調(diào)查總體結(jié)果的68.26%。這叫做正態(tài)分布的比例性，這一特點(diǎn)為本章將要計(jì)論的統(tǒng)計(jì)推斷提供了基礎(chǔ)。

　　5.3.2 標(biāo)準(zhǔn)正態(tài)分布

　　任何正態(tài)分布都可以轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)正態(tài)分布的特點(diǎn)與正態(tài)分布相同。只有標(biāo)準(zhǔn)正態(tài)分布的平均值等于0，標(biāo)準(zhǔn)差等于1。正態(tài)分布的任何一變量值X通過一個(gè)簡(jiǎn)單的轉(zhuǎn)化公式就能變換成相應(yīng)標(biāo)準(zhǔn)正態(tài)分布中的Z值。這種轉(zhuǎn)換是由正態(tài)分布的比例性決定的。用符號(hào)表示：

　　用符號(hào)表示：

　　式中X——變量值;

　　μ——變量平均值;

　　σ——變量標(biāo)準(zhǔn)差。

　　圖5.2 標(biāo)準(zhǔn)正態(tài)分布圖

　　變量Z的標(biāo)準(zhǔn)正態(tài)分布曲線下各塊面積(全部百分比)都列在表5.1中。

　　表5.1 Z值為1，2，3時(shí)標(biāo)準(zhǔn)正態(tài)曲線下方的面積

　　5.4 總體分布、樣本分布和抽樣分布

　　進(jìn)行抽樣調(diào)查，目的是要對(duì)總體做出推斷，而不是為了描述樣本的特征。總體，就像前面定義的，包括可以從中獲取信息達(dá)到調(diào)研目標(biāo)的全部可能的人體或物體。樣本是總體的子集。

　　總體分布是總體中所有單位的頻率分布。這一頻率分布的平均數(shù)，通常用希臘字母μ表示，標(biāo)準(zhǔn)差用希臘字母σ表示。樣本分布是單個(gè)樣本中所有單位的頻率分布。樣本分布的平均數(shù)常用表示，標(biāo)準(zhǔn)差用S表示。

　　在這里，有必要介紹一下三種分布，樣本平均數(shù)的抽樣分布。理解這一分布對(duì)于充分認(rèn)識(shí)估計(jì)簡(jiǎn)單隨機(jī)抽樣誤差的依據(jù)十分重要。樣本平均數(shù)的抽樣分布是指從一個(gè)總體中抽取一定數(shù)量的樣本，由樣本平均數(shù)構(gòu)成的概率分布。雖然人們對(duì)很少計(jì)算這種分布，但它的特性具有很大的實(shí)際意義。要獲得樣本平均數(shù)的分布，首先要從特定總體中抽取一定量的樣本(如25000)，接著，計(jì)算各樣本的平均數(shù)，并排列出頻率分布。因?yàn)槊總€(gè)樣本由樣本單位的不同子集構(gòu)成，因此樣本平均數(shù)不會(huì)完全相同。

　　當(dāng)樣本的單位數(shù)和隨機(jī)性足夠大，樣本平均數(shù)的分布近似于正態(tài)分布。這一論斷的基礎(chǔ)是中心極限定理。該定理說明，隨著樣本容量的增加，從任一總體中抽取的大量隨機(jī)樣本的平均數(shù)的分布接近正態(tài)分布且平均數(shù)等于μ，標(biāo)準(zhǔn)差(也稱之為標(biāo)準(zhǔn)誤差)等于：

　　式中n——樣本單位數(shù)。

　　值得注意的是，中心極限定理的成立不考慮樣本總體的分布形狀，也就是說忽略了總體的分布類型，樣本平均數(shù)的分布會(huì)趨于正態(tài)分布。常用來表示總體分布、樣本分布和抽樣分布的平均數(shù)及標(biāo)準(zhǔn)差的符號(hào)都列在表5-2中。

　　表5.2 參數(shù)、統(tǒng)計(jì)量符號(hào)

　　平均數(shù)的標(biāo)準(zhǔn)誤差()之所以按前面所示的方法計(jì)算是因?yàn)椋粋€(gè)特定的樣本平均數(shù)分布的方差或是離差會(huì)隨著樣本數(shù)量的增加而減少。由常識(shí)可知，樣本數(shù)越大，單個(gè)樣本的平均數(shù)就越接近總體平均數(shù)。圖13-3表明了平均數(shù)的總體分布、樣本分布和抽樣分布之間的關(guān)系。我們將深入討論平均數(shù)的抽樣分布，而另一個(gè)比例抽樣分布，將在以后介紹。

　　5.5 平均數(shù)的抽樣分布

　　5.5.1 基本概念

　　考慮一個(gè)抽樣案例：一位調(diào)查人員以“在最近30天內(nèi)至少吃過一次快餐的所有顧客”為總體，從中抽取了1000組容量為200的簡(jiǎn)單隨機(jī)樣本。調(diào)查目的是要估計(jì)平均一個(gè)月內(nèi)這些人吃快餐的平均次數(shù)。計(jì)算出每一組的平均數(shù)，按相關(guān)值確定區(qū)間，整理后便得到表中5-3的頻率分布圖。而圖5-4以直方圖的形式表示這些頻率，直主圖上方還可見到一條正態(tài)曲線。正如你所看見的，直方圖十分接近正態(tài)曲線的形狀。如果我們選取足夠的容量為200的樣本，計(jì)算每組的平均數(shù)，整理排列后所得的分布就是正態(tài)分布。圖5-4的正態(tài)曲線就是這項(xiàng)調(diào)查中平均數(shù)的抽樣分布。大樣本平均數(shù)的抽樣分布有以下特征：

　　(1)是正態(tài)分布

　　(2)分布的平均數(shù)等于總體平均數(shù)。

　　(3)分布有標(biāo)準(zhǔn)差，稱為平均數(shù)的標(biāo)準(zhǔn)誤差，它等于總體標(biāo)準(zhǔn)差除以樣本容量的平方根：

　　將標(biāo)準(zhǔn)差稱為平均數(shù)的標(biāo)準(zhǔn)誤差表明它更適用于樣本平均數(shù)的分布，而不是總體或樣本的標(biāo)準(zhǔn)差分布。記住這種計(jì)算只適合簡(jiǎn)單隨機(jī)樣本，其他類型的樣本(如分層樣本和整群樣本)要用非常復(fù)雜的分式計(jì)算標(biāo)準(zhǔn)誤差。

　　表5.3 1000個(gè)樣本平均數(shù)的頻數(shù)分布

　　圖5.3 平均數(shù)的實(shí)際抽樣分布

　　5.5.2 根據(jù)單個(gè)樣本做出推斷

　　在實(shí)際操作中，人們往往不愿從總體中抽出所有可能的隨機(jī)樣本，畫出像表5.3和圖5.4那樣的頻率分布表和直方圖來。人們希望進(jìn)行簡(jiǎn)單的隨機(jī)抽樣，并據(jù)此對(duì)總體進(jìn)行統(tǒng)計(jì)推斷。問題出現(xiàn)了，通過任一簡(jiǎn)單的隨機(jī)樣本對(duì)總體均數(shù)進(jìn)行的估計(jì)，其估計(jì)值在總體平均值±1個(gè)標(biāo)準(zhǔn)誤差內(nèi)的概率究竟為多大?根據(jù)表5.2可知概率為68%，因?yàn)樗袠颖酒骄鶖?shù)有68%都在此范圍內(nèi)。而通過簡(jiǎn)單隨機(jī)樣本對(duì)總體做的估計(jì)為實(shí)際總體平均值2倍標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為95%，在實(shí)際總體平均值3倍標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為99.7%。

　　5.5.3點(diǎn)估計(jì)和區(qū)間估計(jì)

　　當(dāng)利用抽樣要對(duì)總體平均值進(jìn)行估計(jì)時(shí)，有兩種估計(jì)方法：點(diǎn)估計(jì)和區(qū)間估計(jì)。點(diǎn)估計(jì)是指把樣本平均值作為總體平均數(shù)的估計(jì)值。觀察圖5.3的平均數(shù)抽樣分布可知某一特定的抽樣結(jié)果，其平均數(shù)很可能相對(duì)更接近總體平均數(shù)。但是，樣本平均數(shù)分布中的任一個(gè)值都可能是這一特定樣本的平均值。有一小部分的樣本平均值與實(shí)際總體平均值有相當(dāng)?shù)牟罹啵@種差距就叫抽樣誤差。

　　抽樣結(jié)果的點(diǎn)估計(jì)在很少的情況下完全準(zhǔn)確，因此人們更偏于區(qū)間估計(jì)。區(qū)間估計(jì)就是對(duì)變量值如總體平均值的區(qū)間或范圍進(jìn)行估計(jì)。除了要說明區(qū)間大小外，習(xí)慣上還要說明實(shí)際總體平均值在區(qū)間范圍以內(nèi)的概率。這一概率通常被稱為置信系數(shù)或者置信度，區(qū)間則被稱為置信區(qū)間。

　　平均數(shù)的區(qū)間估計(jì)按以下步驟推導(dǎo)。從總體上抽出一定量的隨機(jī)樣本，計(jì)算出樣本平均數(shù)，可知這個(gè)樣本平均值存在于所有樣本平均數(shù)的抽樣分布中，但確切位置不清楚。此外還知道，這個(gè)樣本平均數(shù)在實(shí)際總體平均值±1個(gè)標(biāo)準(zhǔn)誤差范圍內(nèi)的概率為68%，由此可知，實(shí)際值等于樣本值加上或減去1個(gè)標(biāo)準(zhǔn)誤差的信度為68%。用符號(hào)表示如下：

　　同理可知，實(shí)際值等于樣本估計(jì)值加上或減去2倍標(biāo)準(zhǔn)誤差(嚴(yán)格上是1.96，但為了計(jì)算簡(jiǎn)單便通常用2)的置信度為95%，實(shí)際值等于樣本值加上或減去3倍標(biāo)準(zhǔn)誤差的置信度為99.7%。

　　以上都假設(shè)總體標(biāo)準(zhǔn)差已知，大多數(shù)時(shí)候，情況不是這樣。如果總體標(biāo)準(zhǔn)差已知，根據(jù)定義可以知道總體平均值，那就沒有必要事先抽取樣本了。而如果不知道總體標(biāo)準(zhǔn)差，那就必須通過樣本差去估計(jì)。

　　5.6 比例的抽樣分布

　　市場(chǎng)研究中經(jīng)常會(huì)偏于進(jìn)行比例或百分比方面的估計(jì)。下面是一些常見例子：

　　l 知道某一廣告的總體百分比;

　　l 平均一周上網(wǎng)1次以上的總體的百分比;

　　l 最近30天內(nèi)吃過快餐和吃過4次以上快餐的總體百分比;

　　l 觀看某一電視節(jié)目的觀眾的總體百分比;

　　在上述情況下，總體比例或百分比是重要的因素，因此有必要介紹比例抽樣分布。

　　從特定總體中抽出大量隨機(jī)樣本，這些樣本的抽樣比例的相對(duì)頻率分布就是比例抽樣分布，它有以下特征：

　　Ø 近似于正態(tài)分布

　　Ø 所有樣本比例的平均值等于總體比例。

　　Ø 比例抽樣分布的標(biāo)準(zhǔn)誤差可以按下面的公式計(jì)算：

　　式中Sp—比例抽樣分票吳差;

　　P—總體比例的估計(jì)值;

　　n—樣本單位數(shù)。

　　考慮一下，如果需要估計(jì)一下最近90天內(nèi)曾在網(wǎng)上購物的所有成年人的百分比，那么就像要得到平均數(shù)的抽樣分布一樣，要從成年人總體中選取1000組容量為200的隨機(jī)樣本，計(jì)算出1000組樣本中所有在最近90天內(nèi)曾在網(wǎng)上購物的人數(shù)比例。這些值排列將形成一個(gè)趨于正態(tài)分布的頻率分布。這一分布的估計(jì)比例標(biāo)準(zhǔn)誤差可以用在前面計(jì)算比例標(biāo)準(zhǔn)誤差的公式來計(jì)算。

　　讀完下一節(jié)，你就會(huì)明白，市場(chǎng)人員對(duì)于樣本容量問題，更趨于進(jìn)行比例估計(jì)而不是平均值估計(jì)，是有其原因的。

　　5.7 樣本容量的確定

　　5.7.1平均值問題

　　考慮前面那個(gè)估計(jì)平均一個(gè)月快餐族吃快餐次數(shù)的案例，如果管理層需要對(duì)顧客的平均光顧次數(shù)做出估計(jì)，從而決定是否實(shí)行正在擬定的新促銷計(jì)劃。為了得到這個(gè)估計(jì)值，市場(chǎng)調(diào)研經(jīng)理打算在總體中考察某個(gè)簡(jiǎn)單隨機(jī)樣本。問題是，確定本次調(diào)查樣本容量的要素是什么?首先，對(duì)于估計(jì)平均值問題，計(jì)算所需的樣本容量的公式是：

　　式中 Z―標(biāo)準(zhǔn)誤差的置信水平;

　　σ―總體標(biāo)準(zhǔn)差;

　　E―可接受的抽樣誤差范圍(允許誤差)

　　計(jì)算所需的樣本容量要有三種資料：

　　(1) 抽樣誤差的可接受的或允許的詳細(xì)范圍(E)。

　　(2) 標(biāo)準(zhǔn)誤差置信水平的允許確切值，也就是Z值。換一種說法，即總體平均值包括在指定置信區(qū)間內(nèi)的置信度是多少?

　　(3) 最后需要估計(jì)一下總體標(biāo)準(zhǔn)差(σ)。

　　計(jì)算中要用到的置信水平(Z)和誤差(E)必須由調(diào)查人員與他(她)的客戶進(jìn)行磋商后才能確定。如前所述，置信水平與誤差范圍的確定不僅要根據(jù)統(tǒng)計(jì)原則，同時(shí)要顧及財(cái)務(wù)與管理方面的要求。理想的情況下，我們總是希望置信度很高，誤差很小。但要知道，這是經(jīng)營(yíng)決策，必須考慮成本問題。因此，要在精確度、置信度與成本之間進(jìn)行權(quán)衡。有的時(shí)候，不要求很高的精確度與置信度。例如，你也許只想通過調(diào)查基本了解一下消費(fèi)者對(duì)產(chǎn)品的普遍態(tài)度是正面有還是負(fù)面的。這里精確度就顯得不太重要了。但如果是一項(xiàng)產(chǎn)品創(chuàng)意測(cè)試，就需要精確度較高的銷售估計(jì)值，以便做出是否向市場(chǎng)推薦某種新產(chǎn)品的高成本、高風(fēng)險(xiǎn)的決策。

　　第三項(xiàng)是總體標(biāo)準(zhǔn)差的估計(jì)值，這是一個(gè)更麻煩的問題。我們?cè)谇懊嬲f過，如果總體標(biāo)準(zhǔn)差已知，那么也就能知道總體平均數(shù)(總體平均數(shù)是用來計(jì)算總體標(biāo)準(zhǔn)差的)。這樣的話就沒必要抽取樣本了。但調(diào)查人員如何不抽取樣本就估計(jì)出總體標(biāo)準(zhǔn)呢?結(jié)合使用以下四種方法可以解決這個(gè)問題：

　　(1) 利用以前的觀察結(jié)果。許多情況下，公司以前曾經(jīng)進(jìn)行過類似的調(diào)查，這時(shí)，可以利用以前的調(diào)查結(jié)果作為本次總體標(biāo)準(zhǔn)差的估計(jì)值。

　　(2) 進(jìn)行試點(diǎn)調(diào)查。如果調(diào)查對(duì)象規(guī)模太大，可以投入一定的時(shí)間和資源對(duì)總體進(jìn)行小規(guī)模的試驗(yàn)調(diào)查。根據(jù)調(diào)查結(jié)果估計(jì)總體標(biāo)準(zhǔn)差確定樣本容量。

　　(3) 利用二手?jǐn)?shù)據(jù)。有時(shí)候通過二手?jǐn)?shù)據(jù)也可以對(duì)總體標(biāo)準(zhǔn)差做出估計(jì)。

　　(4) 通過判斷。如果其他方法都失敗了，還可以判斷總體標(biāo)準(zhǔn)差。即把許多管理人員的判斷集中起來進(jìn)行分析，而這些管理人員都有能力對(duì)有關(guān)的總體參數(shù)做出有所根據(jù)的猜測(cè)。

　　當(dāng)完成了調(diào)查，計(jì)算出樣本平均值和樣本標(biāo)準(zhǔn)差后，調(diào)查人員就可以正確估計(jì)出總體標(biāo)準(zhǔn)差，并確定所需的樣本容量了。這時(shí)如果需要，可以對(duì)以前的抽樣誤差估計(jì)做出調(diào)查。

　　再來考慮估計(jì)快餐族平均每月吃快餐的平均次數(shù)。以下這些值將代入下面的公式。

　　l與公司的管理者進(jìn)行磋商后，市場(chǎng)調(diào)研經(jīng)理認(rèn)為有必要估計(jì)一下吃快餐的平均次數(shù)。考慮到管理者對(duì)精確度的要求，她規(guī)定估計(jì)值不得超過實(shí)際的0.10(1/10)。這個(gè)值(0.01)將作為E值代入公式。

　　l此外，市場(chǎng)調(diào)研經(jīng)理還認(rèn)為，考慮全局，需要把實(shí)際總體平均值在(樣本平均值±E)區(qū)間以內(nèi)的置信度定為95%。而若要置信度為95%，就必須在2倍標(biāo)準(zhǔn)誤差范圍內(nèi)(嚴(yán)格是1.96)。因此，2作為Z值代入公式。

　　l最后，確定公式中的值。幸好公司一年前曾做過類似的調(diào)查。調(diào)查對(duì)象是最近30天內(nèi)吃快餐的平均次數(shù)。其標(biāo)準(zhǔn)差是1.39，以此作為s值最好不過。因此把1.3代入公式。然后進(jìn)行計(jì)算，通過計(jì)算，可知樣本容量為772時(shí)可以滿足提出的要求。

　　5.7.2計(jì)算比例的問題

　　考慮估計(jì)最近90天內(nèi)曾在網(wǎng)上購物的所有成年人的比例或百分比的案例。其目標(biāo)是從成年人總體中抽取一個(gè)簡(jiǎn)單隨機(jī)樣本，估計(jì)其比例是多少。下面討論一下如何確定代入公式的那幾個(gè)值：

　　l 像前面說的，要根據(jù)抽樣結(jié)果估計(jì)總體平均值，首先要確定E的值。例如，假設(shè)可接受的誤差范圍為±2%，那么將0.02作為E的值代入公式。

　　l 其次，假設(shè)調(diào)查人員要求抽樣估計(jì)在實(shí)際總體比例的2%范圍以內(nèi)的置信度為95%，那么按前面講的，把2作為值代入公式。

　　l 最后一點(diǎn)，在一年前的一次類似調(diào)查中，有5%的被調(diào)查者表示在最近90天內(nèi)曾在網(wǎng)上購物。我們可以用0.05作為P值代入公式。

　　計(jì)算過程如下：

　　根據(jù)要求，需要一個(gè)475個(gè)人的隨機(jī)樣本。要注意的是，與確定估計(jì)平均值所需的樣本容量的過程相比，調(diào)查人員在確定估計(jì)比例所需的樣本容量時(shí)有一個(gè)優(yōu)勢(shì)：如果缺乏估計(jì)P的依據(jù)，可以對(duì)P值做最悲觀或最糟糕的假設(shè)。給定Z值和E值，P值為多大時(shí)要求的樣本量最大呢?當(dāng)P=0.5時(shí)，“P(1-P)”有極大值0.25存在，如此設(shè)定P值樣本是最大。而給定Z值和E值，對(duì)于與平均估計(jì)所需樣本量有關(guān)的值就沒有最悲觀的假設(shè)。

　　5.7.3總體容量樣本容量

　　你也許會(huì)注意到計(jì)算樣本容量的公式中沒有一個(gè)用到總體容量。學(xué)生們(和經(jīng)理們)經(jīng)常會(huì)注意到這個(gè)問題。表面上看來好像是要抽取的樣本量越大，其總體容量也應(yīng)該增大。其實(shí)不然。通常，總體容量與在一定誤差和可靠度范圍內(nèi)估計(jì)總體參數(shù)所需的樣本容量之間沒有直接的關(guān)系。實(shí)際上，總體容量只有當(dāng)樣本容量相對(duì)它而言過大時(shí)才會(huì)起作用。根據(jù)經(jīng)驗(yàn)，當(dāng)樣本容量超過總體的5%時(shí)，就需要調(diào)整樣本容量了。一般都假設(shè)樣本的抽取是相互獨(dú)立的(獨(dú)立假設(shè))，這一假設(shè)在樣本相對(duì)于總體很小時(shí)成立。當(dāng)樣本量占總體比例相對(duì)較大(5%以上)時(shí)就不成立了。因此，們必須調(diào) 整一下標(biāo)準(zhǔn)公式。譬如，前面的計(jì)算平均數(shù)標(biāo)準(zhǔn)誤差的公式是：

　　當(dāng)樣本量占總體5%以上，就要推翻獨(dú)立假設(shè)。調(diào)整后的正確公式是：

　　其中，(N-n)/(N-1)被稱為有限總體修正系數(shù)(FPC)。當(dāng)樣本占總體的5%以上，調(diào)查人員可以通過FPC來減少所需的樣本容量。計(jì)算公式如下：

　　式中，n’為修改后的樣本量;n為原樣本量;N為總量。

　　如果總量為2000，原樣本量為400，則：

　　經(jīng)過FPC的調(diào)整，需要的樣本量由原先的400變成了333。

　　問題關(guān)鍵不是樣本量大小與總量大小的關(guān)系，而是選取的樣本是否能真實(shí)代表總體的特性。經(jīng)驗(yàn)表明，經(jīng)過仔細(xì)挑選的樣本，盡管容量不大，卻也能十分準(zhǔn)確地反映總體特征。許多著名的全國(guó)性調(diào)查和民意測(cè)驗(yàn)的樣本數(shù)都不超過2000。蓋洛普民意測(cè)驗(yàn)、哈里斯民意測(cè)驗(yàn)和尼爾森電視節(jié)目受歡迎程度調(diào)查都是很好的例子。這些例子都表明，即使調(diào)查對(duì)象是數(shù)千萬人的行為，也可以通過對(duì)于總體相當(dāng)小的一部分樣本進(jìn)行十分準(zhǔn)確的預(yù)測(cè)。

　　5.7.4確定分層樣本和整體樣本的容量

　　本章列出的計(jì)算樣本容量的公式只適用于簡(jiǎn)單隨機(jī)樣本。當(dāng)然也有適用于其他如分層樣本、整群樣本確定樣本容量和抽樣誤差范圍的公式。雖然本章提到的許多概念對(duì)這些樣本都適用，但它們的計(jì)算公式卻要復(fù)雜很多。而且，公式中要用到的數(shù)據(jù)往往很難得到。因此，這些樣本的容量確定問題超過了本書的介紹范圍。有興趣的讀者可以參考高級(jí)教材。

　　5.8統(tǒng)計(jì)權(quán)

　　盡管在市場(chǎng)調(diào)研中用本章節(jié)公式計(jì)算樣本量是十分標(biāo)準(zhǔn)的作法，但這些公式都只承認(rèn)第一類誤差(不存在差值時(shí)推斷差值存在而產(chǎn)生的誤差)。它們顯然不考慮第二類誤差，即實(shí)際存在差值時(shí)認(rèn)為沒有差值而產(chǎn)生的誤差。不發(fā)生第二類誤差的概率叫統(tǒng)計(jì)權(quán)。計(jì)算樣本容量的標(biāo)準(zhǔn)公式默認(rèn)統(tǒng)計(jì)權(quán)為50%。舉個(gè)例子，如果要確定兩種產(chǎn)品中哪一個(gè)對(duì)目標(biāo)顧客群更有吸引力，并且可能進(jìn)行購買的目標(biāo)顧客的百分比之間可以有5%的差值，這時(shí)標(biāo)準(zhǔn)樣本容量公式要求每項(xiàng)產(chǎn)品需要的樣本容量大約為400。通過這一計(jì)算，我們默認(rèn)了一個(gè)事實(shí)，即有50%的可能我們會(huì)錯(cuò)誤地推斷出兩種產(chǎn)品具有相等的吸引力。

　　參考文獻(xiàn)：

　　1 《當(dāng)代市場(chǎng)調(diào)研》 Carl McDaniel,Jr and Roger Gates 著，范秀成等譯機(jī)械工業(yè)出版社出版 2001

　　2 《實(shí)用統(tǒng)計(jì)分析方法》蔣慶瑯著，方積乾等譯北京大學(xué)、中國(guó)協(xié)和醫(yī)科大學(xué)聯(lián)合出版社出版 1998

　　3 《社會(huì)統(tǒng)計(jì)分析方法》郭志剛主編中國(guó)人民大學(xué)出版社出版 1999
上一篇下一篇

中国一片免费观看-中国性xxxxxbbbbb-中国午夜性春猛交xxxx-中国偷拍性A片XXXXX-中国日韩欧美中文日韩欧美色-中国日本高清免费视频网

統(tǒng)計(jì)基礎(chǔ)

第5章樣本容量的確定

中国一 片免费观看-中国性xxxxxbbbbb-中国午夜性春猛交xxxx-中国偷拍性A片XXXXX-中国日韩欧美中文日韩欧美色-中国日本高清免费视频网

統(tǒng)計(jì)基礎(chǔ)

第5章 樣本容量的確定

中国一片免费观看-中国性xxxxxbbbbb-中国午夜性春猛交xxxx-中国偷拍性A片XXXXX-中国日韩欧美中文日韩欧美色-中国日本高清免费视频网

第5章樣本容量的確定