求問統計學裡的P值是什麼含義?請用通俗易懂的語言解釋,謝謝

2021-03-27 20:23:15 字數 5093 閱讀 2888

1樓:語言學新兵

你需要的可能是乙個故事。

從前,你有個朋友,他每月開一輛小貨車去市場裡採購東西,然後再把所有這些東西轉賣出去。月復一月,年復一年。

但是,因為市場**變動,每乙個月他賣東西得到的毛爺爺數目並不一樣,差不多有個5000塊錢左右吧。你呢能看到他每個月的收入統計。

時間長了,有一次,無聊的你準備戲耍一下這個無辜的小夥伴,你偷偷在他的小貨車上裝了一小瓶尿。既然他肯定會在集市上賣掉所有東西,那麼這一小瓶尿他一定也會賣出去,只不過這瓶尿的**可能也就是零吧。

這一次他賺了5400塊,這可比以往的平均數5000塊錢還多。那問題就來了:為什麼這個月他賺的比平常多呢?

有兩種情況:其一,你那瓶尿很值錢,他自然會多賺;其二,你那瓶尿根本不值錢,他多賺了只是因為這個月市場上**不錯。

那到底是哪種情況呢?這個問題的實質是,你那瓶尿到底值不值錢。如果這瓶尿根本不值錢,那他賣東西和以前賣東西的情況沒什麼兩樣,只不過是市場**影響而已。

於是,你翻了他以前賣東西的紀錄,算了算所有他的個人月收入超過5400塊的概率,大概是0.1。也就是說在你這瓶尿沒有任何價值的情況下,只靠市場**,他只有0.

1的概率賣到5400塊。

所以你得出的結論是,你的那瓶尿有價值,你這個結論的p值就是0.1。

===================

故事講完了,來分析一下。

為什麼要用p值?換句話說,為什麼要做推斷統計?我想,p值到底是啥並不重要,我知道你做研究時多半只是負責看看p到底有沒有比0.05小的。而這個問題,才是我最想告訴你的。

推斷統計,之所以要「推斷」,是因為我們沒有辦法正面驗證某種情況。在這個故事中,你以前沒乾過偷偷把一瓶尿放在車上的事兒,他以前也沒賣過你的尿,所以儘管你有的是他的銷售資料,但那些舊賬本沒辦法正面告訴你你的尿到底值不值錢。

這就是「沒辦法正面驗證」,在這樣的情況下,你就沒辦法了麼?非也,我們可以換個角度考慮這個問題,假設「你那瓶尿毫無價值」是成立的,他賣了這瓶尿跟沒賣時候沒什麼兩樣,那這一次和以往自然也沒什麼兩樣。既然這次賣東西和以往一樣,那舊賬本中的記錄就能幫到你了。

你可以算算舊賬本,他在沒賣過你那瓶尿的情況下,賺到5400塊及以上的可能性(概率),這個概率就是「你那瓶尿毫無價值」的概率,這裡也就是0.1.

這樣,「你那瓶尿有價值」的概率,當然就是這個假設的相反情況,也就是0.9,這也是你的假設成立的可能性。

那這個p值到底顯著與否呢?那得看市場**。這裡市場**是隨機的,所以「顯著」與否簡單點就是在說你那瓶尿能不能跑贏市場。

業內經常以兩個標準差作為衡量「顯著」的標準。絕大多數情況下,作為隨機變數的市場**服從正態分佈。而正態分佈中,超過兩個標準差的概率是0.

05,這也就是為什麼大家要拿0.05作為「公認」的顯著性水平尺度了。

統計推斷,核心就是反證法。你那瓶尿沒價值的可能性越小,反而越能證明你那瓶尿有價值。

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離」

這是你的書上寫的定義,但是很明顯,你把結尾最重要的「的概率」三個字漏掉了。正常情況下,這個定義應該是

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離的概率」

不信你可以再看看你的書。

但是,怎麼可以容忍這麼***的定義?我們來用這個故事做個轉換吧:

「在原假設成立的情況下」 -> 在你那瓶尿不值錢情況下

「抽到的統計量與原假設之間的距離」 -> 他舊賬本裡的銷售記錄

「至少等於」 -> 大於或等於

"樣本計算值與原假設之間的距離" -> 他這一次的銷售記錄(5400塊)

「的概率」 -> 的概率

連起來讀讀,p值的定義就變成:

「在你那瓶尿不值錢的情況下,他舊賬本裡的銷售記錄大於或等於他這一次的銷售記錄(5400塊錢)(這個事件發生)的概率。」

這一次,好懂了點嗎?

最後要說明,說得通俗易懂是要承擔風險的,因為通俗很可能意味著不嚴謹,易懂很可能意味著不周全。以上有很多有失嚴謹之處,希望題主還要多多看書哇。

最後的最後,為什麼我要用「一瓶尿」這樣乙個非常粗俗**的故事?因為所謂的p value,不就是用來證明你的pee value的麼?

個人觀點,僅供參考!

2樓:喵喵喵

專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p=0.

05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即

假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有乙個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果。

當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

擴充套件資料

所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。

當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,。這種條件下有兩種方法:一是用替代的非引數檢驗(即無分布性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。

另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。後一種方法是基於乙個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。

即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分布並不呈正態。

統計學中的顯著性水平α和p分別是什麼意思?請詳細解答,謝謝~

3樓:禾鳥

1、顯著性水平是估計總體引數落在某一區間內,可能犯錯誤的概率,用α表示。

顯著性是對差異的程度而言的,程度不同說明引起變動的原因也有不同:一類是條件差異,二類是隨機差異,是在進行假設檢驗時事先確定乙個可允許的作為判斷界限的小概率標準。

2、p值是用來判定假設檢驗結果的乙個引數,也可以根據不同的分布使用分布的拒絕域進行比較。

p值(p value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理就有理由拒絕原假設,p值越小,拒絕原假設的理由越充分。

總之,p值越小,表明結果越顯著。但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要根據p值的大小和實際問題來解決。

擴充套件資料

顯著性水平的理解:

顯著性水平是在進行假設檢驗時事先確定乙個可允許的作為判斷界限的小概率標準。檢驗中,依據顯著性水平大小把概率劃分為二個區間,小於給定標準的概率區間稱為拒絕區間,大於這個標準則為接受區間。

事件屬於接受區間,原假設成立而無顯著性差異;事件屬於拒絕區間,拒絕原假設而認為有顯著性差異 。對顯著水平的理解必須把握以下二點:

1、顯著性水平不是乙個固定不變的數值,依據拒絕區間所可能承擔的風險來決定。

2、統計上所講的顯著性與實際生活工作中的顯著性是不一樣的。

4樓:余浩

顯著性水平α在統計學中叫做犯第一類錯誤的大小,第一類錯誤就是原假設是對的,但是被拒絕的概率,我們一般把這個顯著性水平α定為0.05。

假設有個檢驗統計量是f,然後把樣本資料代入f可以算出乙個值記為f,那麼p值就是在原假設成立的條件下p(f>f)這個概率大小,如果p值小於給定的顯著性水平α我們就拒絕原假設,否則不拒絕。

統計學中的t檢驗、p值是什麼意思?求深入淺出、通俗易懂解釋

5樓:

在回歸分析中,t檢驗就是對回歸引數的顯著性進行檢驗;f檢驗是對回歸方程的顯著性進行檢驗。在一元回歸中,二者是等價的;在多元回歸中,t檢驗通過則f檢驗一定能夠通過,而f檢驗通過t檢驗不一定通過。p值就是方便大家判斷顯著性的,一般軟體執行結果中都有,例如在a=0.

05時,p<0.05,就拒絕原假設,說明顯著!

統計學中t值p值是什麼意思?怎麼計算?

6樓:不是苦瓜是什麼

1、t指的是t檢驗,亦稱student t檢驗(student's t test),主要用於樣本含量較小(n<30),總體標準

差σ未知的正態分佈資料。

計算:t的檢驗是雙側檢驗,只要t值的絕對值大於臨界值就是不拒絕原假設。

2、p值(p value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,p值越小,我們拒絕原假設的理由越充分。

計算:概率定義為:p(a)=m/n,其中n表示該試驗中所有可能出現的基本結果的總數目。m表示事件a包含的試驗基本結果數。

統計學是關於認識客觀現象總體數量特徵和數量關係的科學。它是通過蒐集、整理、分析統計資料,認識客觀現象數量規律性的方**科學。由於統計學的定量研究具有客觀、準確和可檢驗的特點,所以統計方法就成為實證研究的最重要的方法,廣泛適用於自然、社會、經濟、科學技術各個領域的分析研究。

7樓:匿名使用者

簡單地說,t值和p值都用來判斷統計上是否顯著的指標, 例如不良貸款y對貸款餘額的估計方程x的回歸估計方程為:y=-0.8+0.

03x,那麼這個方程的係數0.03是否在統計上有意義呢?是否貸款餘額沒增加1個單位,不良貸款就要增加0.

03個單位呢?那麼可以通過計算其t值和p值來判斷,經計算t=7.5,p=0.

000,根據假設檢驗的相關知識,可以判斷這個方程式有意義的。

我認為,要想把它弄清楚,還是需要找本統計學原理的書看看好

8樓:東哥

,t值和p值都用來判斷統計上是否顯著的指標。

p值就是拒絕原假設的最小alpha值嘛,把統計量寫出來,帶進去算出來之後,根據統計量的分布來算p值啊,舉個例子,比如說算出來的統計量的值為z,服從的是正態分佈,如果是雙邊檢驗的話那麼pvalue=2*(1-probnorm(abs(z)));

單邊檢驗的話,應該是1-probnorm(z);

具體問題具體分析,不同的檢驗方法求p值方法也不一樣,統計的書上肯定都有;t值計算方法相似。

統計學p值0代表什麼意思統計學p值0代表什麼意思?

統計學意義 p值 zt 結果的統計學意義是結果真實程度 能夠代表總體 的一種估計方法。專業上,p值為結果可信程度的乙個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。如p 0.05提示樣本中變數關聯有5 的可能是由於...

P value如何計算,統計學中的P值應該怎麼計算

假設檢驗是推斷統計中的一項重要內容。用sas spss等專業統計軟體進行假設檢驗,在假設檢驗中常見到p 值方法 p value,probability,pr 這是由於它更容易應用於計算機軟體中。統計學根據顯著性檢驗方法所得到的p 值,一般以p 0.05 為顯著,p 0.01 為非常顯著,其含義是樣本...

統計學裡的f是什麼意思,統計學中t,p,f是什麼意思

是抄f統計量麼,可能是f檢驗bai.f檢驗又叫方差齊性檢驗.在兩樣本 dut檢驗中要用到f檢驗.從兩研zhi究總體中隨dao機抽取樣本,要對這兩個樣本進行比較的時候,首先要判斷兩總體方差是否相同,即方差齊性.若兩總體方差相等,則直接用t檢驗,若不等,可採用t 檢驗或變數變換或秩和檢驗等方法.其中要判...