相關係數越大,說明兩個變數之間的關係就越強嗎

2021-03-04 07:25:23 字數 5555 閱讀 5284

1樓:月似當時

樣本的簡單相關係數一般用r表示,計算公式為:

r 的絕對值越大表明相關性越強,要注意的是這裡並不存在因果關係。若r=0,表明兩個變數間不是線性相關,但有可能是其他方式的相關(比如曲線方式)。

利用樣本相關係數推斷總體中兩個變數是否相關,可以用t 統計量對總體相關係數為0的原假設進行檢驗。若t 檢驗顯著,則拒絕原假設,即兩個變數是線性相關的;若t 檢驗不顯著,則不能拒絕原假設,即兩個變數不是線性相關。

擴充套件資料

一些實際工作者用非居中的相關係數(與pearson係數不相相容)。

例如:假設五個國家的國民生產總值分別是1、2、3、5、8(單位10億美元),又假設這五個國家的貧困比例分別是11%、12%、13%、15%、18%。

則有兩個有序的包含5個元素的向量x、y:x = (1, 2, 3, 5, 8) 、 y = (0.11, 0.

12, 0.13, 0.15, 0.

18) 使用一般的方法來計算向量間夾角(參考數量積)。

上面的資料實際上是選擇了乙個完美的線性關係:y

= 0.10 + 0.01 x。因此皮爾遜相關係數應該就是1。

把資料居中(x中資料減去 e(x) = 3.8 ,y中資料減去e(y) =

0.138)後得到:x = (−2.

8, −1.8, −0.8, 1.

2, 4.2)、 y = (−0.028, −0.

018, −0.008,

0.012, 0.042)。

2樓:禾鳥

相關係數越大,說明兩個變數之間的關係就越強。當相關係數為1時,兩個變數其實就是一次函式關係。

相關係數介於0與1之間,用以反映變數之間相關關係密切程度的統計指標。相關係數是按積差方法計算,同樣以兩變數與各自平均值的離差為基礎,通過兩個離差相乘來反映兩變數之間相關程度;著重研究線性的單相關係數。

相關係數是最早由統計學家卡爾·皮爾遜設計的統計指標,是研究變數之間線性相關程度的量,一般用字母 r 表示。由於研究物件的不同,相關係數有多種定義方式,較為常用的是皮爾遜相關係數。

擴充套件資料

(1)相關係數的應用

1、概率論

例:若將一枚硬幣拋n次,x表示n次試驗中出現正面的次數,y表示n次試驗中出現反面的次數。計算ρxy。

解:由於x+y=n,則y=-x+n,根據相關係數的性質推論,得ρxy = − 1。

2、企業物流

例:一種新產品上市,在上市之前,公司的物流部需把新產品合理分配到全國的10個倉庫,新品上市乙個月後,要評估實際分配方案與之前考慮的其他分配方案中,是實際分配方案好還是其中尚未使用的分配方案更好。

通過這樣的評估,可以在下一次的新產品上市使用更準確的產品分配方案,以避免由於分配而產生的積壓和斷貨。表1是根據實際資料所列的數表。

通過計算,很容易得出這3個分配方案中,b的相關係數是最大的,這樣就評估到b的分配方案比實際分配方案a更好,在下一次的新產品上市分配計畫中,就可以考慮用b這種分配方法來計算實際分配方案。

3、聚類分析

例:如果有若干個樣品,每個樣品有n個特徵,則相關係數可以表示兩個樣品間的相似程度。藉此,可以對樣品的親疏遠近進行距離聚類。

例如9個小麥品種(分別用a1,a2,...,a9表示)的6個性狀資料見表2,作相關係數計算並檢驗。

由相關係數計算公式可計算出6個性狀間的相關係數,分析及檢驗結果見表3。由表3可以看出,冬季分蘖與每穗粒數之間呈現負相關(ρ = − 0.8982),即麥冬季分蘖越多,那麼每穗的小麥粒數越少,其他性狀之間的關係不顯著。

(2)相關係數的缺點:

需要指出的是,相關係數有乙個明顯的缺點,即它接近於1的程度與資料組數n相關,這容易給人一種假象。

因為,當n較小時,相關係數的波動較大,對有些樣本相關係數的絕對值易接近於1;當n較大時,相關係數的絕對值容易偏小。特別是當n=2時,相關係數的絕對值總為1。因此在樣本容量n較小時,我們僅憑相關係數較大就判定變數x與y之間有密切的線性關係是不妥當的。

3樓:西域牛仔王

相關係數介於 -1 與 1 之間,是衡量兩個變數之間線性關係程度的量,

相關係數越大,說明兩個變數之間的線性關係越強。

當相關係數為 1 時,兩個變數其實就是一次函式關係。

4樓:匿名使用者

相關性的強度確實是用相關係數的大小來衡量的,但相關大小的評價要以相關係數顯著性的評價為前提,我們首先應該檢驗相關係數的顯著性,如果顯著,證明相關係數有統計學意義,下一步再來看相關係數大小,如果相關係數沒有統計學意義,那意味著你研究求得的相關係數也許是抽樣誤差或者測量誤差造成的,再進行一次研究結果可能就大不一樣,此時討論相關性強弱的意義就大大減弱了。

在滿足相關係數顯著的條件下,相關係數越大,相關性就越強,這沒錯

5樓:獨梅印血

強強強強強強強強強強強強強強強強強強強強強強強強強強強強

對兩個變數之間的相關係數r越大,相關程度越大,對還是錯

6樓:匿名使用者

首先,相關係數只能衡量線性相關的程度,不能衡量非線性相關的程度

其次,如上面回答的,對於線性相關性的程度高低取決於相關係數絕對值的大小。

7樓:匿名使用者

首先r的範圍是(-1,1),應該是絕對值越接近1越線性相關,接近-1是負線性相關,接近1是線性相關

相關係數越大,說明兩個變數之間的關係就越強嗎

8樓:西域牛仔王

相關係數介於 -1 與 1 之間,是衡量兩個變數之間線性關係程度的量,

相關係數越大,說明兩個變數之間的線性關係越強。

當相關係數為 1 時,兩個變數其實就是一次函式關係。

9樓:陀成寶綢

相關性的強度確實是用相關係數的大小來衡量的,但相關大小的評價要以相關係數顯著性的評價為前提,我們首先應該檢驗相關係數的顯著性,如果顯著,證明相關係數有統計學意義,下一步再來看相關係數大小,如果相關係數沒有統計學意義,那意味著你研究求得的相關係數也許是抽樣誤差或者測量誤差造成的,再進行一次研究結果可能就大不一樣,此時討論相關性強弱的意義就大大減弱了。

在滿足相關係數顯著的條件下,相關係數越大,相關性就越強,這沒錯

相關係數r等於0,說明兩個變數之間不存在相關關係。這樣說對嗎?

10樓:匿名使用者

是不對的。

pearson相關係數的適用條件:

1、適用於線性相關的情形,對於曲線相關等更為複雜的情形、積差相關係數的大小並不能代表相關性的強弱。

2、無明顯異常值,存在極端值則予剔除或轉換。

3、變數呈雙變數正態分佈,如各自服從正態分佈兩個變數計算pearson相關係數、假陽率偏高一點。

擴充套件資料

利用樣本相關係數推斷總體中兩個變數是否相關,可以用t 統計量對h0假設(即二者相關係數為0)進行檢驗。若t檢驗顯著,則拒絕原假設,即兩個變數是線性相關的;反之,則不能拒絕原假設,即兩個變數不是線性相關的。

r的取值為,-1~+1。r>0表明兩個變數是正相關,即乙個變數的值越大,另乙個變數的值也會越大;r<0表明兩個變數是負相關,即乙個變數的值越大另乙個變數的值反而會越小。

r 的絕對值越大,則兩變數相關性越強。若r=0,表明兩個變數間不是線性相關,但可能存在其他方式的相關(比如曲線方式)。

(1)一般認為:|r|≥0.8時,可認為兩變數間高度相關;0.

5≤|r|<0.8,可認為兩變數中度相關;0.3≤|r|<0.

5,可認為兩變數低度相關;|r|<0.3,可認為兩變數基本不相關。

(2)也有認為:|r|≥0.8時,可認為兩變數間極高度相關;0.

6≤|r|<0.8,可認為兩變數高度相關;0.4≤|r|<0.

6,可認為兩變數中度相關;0.2≤|r|<0.4,可認為兩變數低度相關;|r|<0.

2,可認為兩變數基本不相關。

(3)還有認為:|r|≥0.7時,可認為兩變數間強相關;0.

4≤|r|<0.7,可認為兩變數中度相關;0.2≤|r|<0.

4,可認為兩變數弱相關;|r|<0.2,可認為兩變數極弱相關或不相關。

11樓:demon陌

相關係數r等於0,說明兩個變數之間不存在相關關係。這樣說不對。

依據相關現象之間的不同特徵,其統計指標的名稱有所不同。如將反映兩變數間線性相關關係的統計指標稱為相關係數(相關係數的平方稱為判定係數);將反映兩變數間曲線相關關係的統計指標稱為非線性相關係數、非線性判定係數;將反映多元線性相關關係的統計指標稱為復相關係數、復判定係數等。

12樓:du知道君

相關係數是乙個介於-1到+1之間(包括+-1)的數,r=1表明兩變數完全正相關,r=-1表明完全負相關,0表示兩個變數之間沒有任何相關性,在x-y散點圖上表示為類似白雜訊的分布,均勻的布滿整個座標平面

13樓:匿名使用者

相關係數r等於0,說明兩個變數之間不存在相關關係 這句話是對滴不存在相關關係和完全不相關是一樣的

下列四個命題正確的是______(1)線性相關係數r越大,兩個變數的線性相關性越強,反之,線性相關性越弱(

14樓:毀一滅

根據線性相關係數r,|r|越大兩個變數的線性相關性越強,∴(1)不正版確;根據殘差平方和越小權預報精度越高.∴擬合的效果越好,∴(2)正確;

根據相關指數r2的計算公式及與殘差平方和的關係,r2越大,殘差平方和越小,模擬效果越好,∴(3)不正確;

∵(12)a

=(13)b

?a=b=0,∴④不正確.

故答案是(2)

相關係數為負的兩個變數之間是不是必然是負相關

15樓:芥末留學

從相關係數的大小來看,是高相關而且是極強的相關。方向是負相關,也就是說隨著乙個變數的增大,另乙個會逐漸減校 總之就是高負相關,一般而言高相關表示兩個變數的關聯實際意義較大。 至於這個相關有沒有統計學意義,要看顯著性檢驗

spss做的多元回歸分析中,相關係數的大小能不能說明兩個變數對因變數的影響程度的大小之分

16樓:匿名使用者

多元回歸分bai析中,首du先要看x對y有沒有呈現zhi出顯著性影響,dao如果說自變數回x已經對因變數y產生顯著影響(p< 0.05),還想

答對比影響大小,可使用標準化係數( beta)值的大小對比影響大小,beta值大於0時正向影響,該值越大說明影響越大。beta值小於0時負向影響,該值越**明影響越大。

多元回歸分析可以用網頁版spssau中的線性回歸分析即可,同時輸出的智慧型文字分析可自動解讀分析結果。

17樓:劉得意統計服務

多元回歸中,自變數對因變數有沒有影響,影響大小,主要看顯著性檢驗,內即p值。

p值小於0.05,則通過了檢驗容,認為該因素對因變數有顯著影響。

對於通過了影響的自變數,如果要比較哪個影響大,哪個影響小,除了看符號的正負外,還可以看標準後的回歸係數。

用MATLAB求兩個矩陣的相關係數

主函式 來clc clear all a 1,2,3,4 2,4,5,6 23,34,2,0 b 2 3 5 a是源4列3行 b是1列3行 m,n size a corr zeros 1,n for i 1 n corr i min min corrcoef a i b enddisp corr 顯...

下列命題正確的是1線性相關係數r越大,兩

根據線性相關係數r,r 越大兩個變數的線性相關性越強,1 不正版確 根據殘差平方和越小權預報精度越高.擬合的效果越好,2 正確 根據相關指數r2的計算公式及與殘差平方和的關係,r2越大,殘差平方和越小,模擬效果越好,3 不正確 12 a 13 b a b 0,4不正確.故答案是 2 下列四個命題正確...

研究兩個變數之間的相關關係及程度用什麼方法

研究兩個變數的相關性,你可以構建線性回歸模型 或是其他模型,看具體研究問題 一般寫 先對模型中變數進行相關性分析,然後,再對你所建的模型回歸分析。這得根據你的研究問題而定 根據相關係數的定義,可知相關係數是度量兩個變數之間線性相關關係的強度,r的絕對值越接近於1,表示兩個變數的線性相關性越強,r的絕...