壹、假設檢驗問題
參數估計和假設檢驗是統計推斷的兩個重要方面。參數估計以“數”為輸出結果,假設檢驗以“判斷”為輸出結果。為了說明它的基本思想,我們先來看壹個例子。
二、假設檢驗步驟
1,建立壹個假設。
假設檢驗的第壹步是建立假設,通常需要建立兩個假設:原假設Ho和備選假設H1。
2.選擇檢驗統計並確定拒絕域的形式。
如果我們檢驗總剩余的平均值,那麽我們將使用樣本平均值來導出檢驗統計量;如果我們檢驗正態總體的方差,我們將從樣本方差中得到檢驗統計量。
根據統計量的值,將整個樣本空間分為拒絕域w和非拒絕域a兩部分,當樣本統計量的值落在拒絕域內時,將拒絕原假設,否則不拒絕原假設。因此,我們必須找出假設檢驗中的拒絕域。
根據不同的替代假設;拒絕域可以是雙向的,也可以是單向的。在確定拒絕域的類型之後,還應該確定臨界值。這個要根據允許出錯的概率來確定。
3.在測試中給出顯著性水平A。
在判斷原假設是否成立時,由於樣本的隨機性,在判斷中可能出現兩種錯誤,其含義如下表所示。1誤差是當原假設為真時,由於樣本的隨機性,樣本的觀測值落在拒絕域W內,從而做出拒絕原假設的決策。這種誤差稱為1誤差,也稱為棄真概率。
第二種錯誤的解釋:如果鋼筋的平均抗拉強度真的比原來的高,那麽鋼筋的平均抗拉強度就不再是2 000kg了,但是我們並沒有拒絕H0沒有提高的錯誤,就是把“提高了”誤認為“沒有提高”。壹般來說,當H0失敗時,我們沒有拒絕H0,這是第二種錯誤。
4.給出臨界值並確定拒絕域。
在顯著性水平為a的情況下,可以根據給定的檢驗統計量的分布,通過查表得到臨界值,從而確定具體的拒絕域。在不同的替代假設下,拒絕域、臨界值和顯著性水平A之間的關系是不同的。
5、根據樣本觀測值,計算檢驗統計值。收集樣本數據並計算測試統計值。
6.根據檢驗統計值是否屬於拒收域進行判斷。
①將檢驗統計值與拒絕域的臨界值進行比較,當其落入拒絕域時,做出拒絕。
定下結論,或者做出無法拒絕原假設的結論。
(2)從測試統計中計算P值。所謂P值,就是原假設成立時的現狀概率(嚴格來說,原假設成立時的現狀或對原假設更不利的情況,即對備選假設更有利的情況的概率)。當這個概率很小時(比如小於0.05),在原假設成立的情況下,這個結果不應該出現在壹個實驗中;但現在確實出現了,所以我們有理由認為“原假設成立”的前提是錯誤的,應該拒絕原假設,接受替代假設。因此,可以有壹個最壹般的規則:如果P
(3)根據樣本的觀測值,可以得到總體參數的置信區間。如果原假設的參數值不落入這個置信區間,則得出原假設被拒絕的結論,否則得出原假設不能被拒絕的結論。目前大多數統計軟件都提供了相應的置信區間,用這種方法判斷比較方便。