做回歸分析時,什麼時候要取對數,什麼時候不取對數

2021-04-17 20:33:17 字數 2133 閱讀 6097

1樓:

變數不符合正態分佈,可以考慮對數

進行回歸分析時,是先把資料標準化再取對數還是取對數後再標準化?謝謝。。

2樓:匿名使用者

就回歸分析而言,標準化不是必要的,因為標準化是資料的線性變換,不影響估計的顯著性。

計量模型一般不進行標準化,保持變數的原汁原味,方便估計結果的解釋。多元統計裡經常要標準化,如主成份分析,因子分析等。

對數變換的主要目的:(1)估計的係數可以解釋成彈性,一般用在經濟學模型裡;(2)可以降低樣本異方差程度;(3)減少變數的波動,與其他變數的波動水平相適應。

對數變換要求原始變數為正,如果先標準化可能會出現負值,對數變換就不行了。只能對正取值的變數先取對數,再標準化。

為什麼相關或回歸分析時 x和y取log

3樓:

取對數作用主要有:

縮小資料的絕對數值,方便計算。例如,每個資料項的值都很大,許多這樣的值進行計算可能對超過常用資料型別的取值範圍,這時取對數,就把數值縮小了,例如tf-idf計算時,由於在大規模語料庫中,很多詞的頻率是非常大的數字。

2. 取對數後,可以將乘法計算轉換稱加法計算。

3. 某些情況下,在資料的整個值域中的在不同區間的差異帶來的影響不同。例如,中文分詞的mmseg演算法,計算語素自由度時候就取了對數,這是因為,如果某兩個字的頻率分別都是500,頻率和為1000,另外兩個字的頻率分別為200和800,如果單純比較頻率和都是相等的,但是取對數後,log500=2.

69897, log200=2.30103, log800=2.90308 這時候前者為2log500=5.

39794, 後者為log200+log800=5.20411,這時前者的和更大,取前者。因為前面兩個詞頻率都是500,可見都比較常見。

後面有個詞頻是200,說明不太常見,所以選擇前者。

從log函式的影象可以看到,自變數x的值越小,函式值y的變化越快,還是前面的例子,同樣是相差了300,但log500-log200>log800-log500,因為前面一對的比後面一對更小。

也就是說,對數值小的部分差異的敏感程度比數值大的部分的差異敏感程度更高。這也是符合生活常識的,例如對於**,買個家電,如果**相差幾百元能夠很大程度影響你決策,但是你買汽車時相差幾百元你會忽略不計了。

4. 取對數之後不會改變資料的性質和相關關係,但壓縮了變數的尺度,例如800/200=4, 但log800/log200=1.2616,資料更加平穩,也消弱了模型的共線性、異方差性等。

5. 所得到的資料易消除異方差問題。

6. 在經濟學中,常取自然對數再做回歸,這時回歸方程為 lny=a lnx+b ,兩邊同時對x求導,1/y*(dy/dx)=a*1/x, b=(dy/dx)*(x/y)=(dy*x)/(dx*y)=(dy/y)/(dx/x) 這正好是彈性的定義。

請問為何在多元回歸方程中,因變數取對數,而自變數不取?對因變數取對數的原因和意義是什麼?

4樓:

因為你原來的方程模型肯定是道格拉斯模型。w=c×exp(be)×exp(cx)×μ

為了回歸分析,就左右版

取對數,如此連乘權變成連加也就是線性。等到你得出回歸值a尖,b尖,c尖, 帶回原方程就好了。

取對數是計算方便。講起意義還是要脫了對數才能說。

5樓:我笑蒼天天笑我

我感覺讓我這個沒文化的人看你的問題我只能會你一句,按勞取酬,你的計算方式完全就是個脫褲子放屁,完全沒意義。

spss 回歸分析中自變數取了自然對數還用在標準化嗎

6樓:天刃士

這個問題問得有點奇怪,因為取對數本來就是一種標準化的手段,但是這又要看你自變數的原始資料分布呈現什麼形態了。如果是非常嚴重的正向偏態分布或者負向偏態分布才需要取自然對數或者反射自然對數,如果是其他形態的分布則要採取其他手段。

因此,是否標準化和怎麼樣標準化得看你的原始資料的分布圖。然而,很多資料在標準化以後仍然呈非正態分佈,這很正常,但是不能進一步再去標準化了,否則偏離太大到時候無法解釋清楚了。

7樓:匿名使用者

標準化和對數,沒任何關係的

我經常幫別人做這類的資料分析的

什麼時候可以取對數求導,求導的時候,取對數,有的時候用ln,可是有的時候用eln。到底什麼時候用哪個呢

取了對數之後,左右兩邊都變成了新的復合函式 求導的時候,取對數,有的時候用ln,可是有的時候用e ln。到底什麼時候用哪個呢?哪種套用復合函式求導法則方便理解用哪種,覺得自己容易理解哪種就用哪種 取對數求導法 對數求導法講解,你學會了嗎 自然對數 就是對e求對數 即ln 對數運算有幾個規律 ln x...

在用導數求單調性時,什麼時候取等號,什麼

將等號所求值帶入未求導時的原函式,若原函式為常數函式,則不取等號 一般地,在用導數求單調性時,不取等號。即由f x 0,或f x 0解出x。在結論單調區間時,若區間端點屬於定義域 且連續 可以取閉 否則取開。在用導數求單調性時,什麼時候取等號,什麼時候不取?看情況,先取等號看看,代回去能行不,行就取...

梅艷芳去世時多大梅艷芳是什麼時候死的?為什麼死的?死的時候幾歲?

梅艷芳去世時40歲。梅艷芳,祖籍廣西壯族自治區北海市合浦縣,1963年10月10日出生於香港,家中兩兄一姐,她排行最小。2003年12月30日2 50分,梅艷芳因宮頸癌導致肺功能衰竭,在香港養和醫院病逝。2004年1月梅艷芳葬禮期間,治喪委員會以 別矣,香港的女兒!為題刊登訃聞。2004年1月10日...