協(xié)方差是指(協(xié)方差函數(shù)是干什么的)
來源:好上學(xué) ??時間:2022-08-18
離均差、方差、均方差、協(xié)方差這幾個數(shù)學(xué)名詞都聽上去都差不多,可是在日常工作生活中能用得上這些概念的人應(yīng)該不多,今天就來說說其中的差別。
要想搞清楚什么是離均差、方差、均方差和協(xié)方差,得先從均值這個概念開始。哪怕是數(shù)學(xué)再不好的人,也應(yīng)該知道算術(shù)平均數(shù)是怎么回事吧。
以標(biāo)準(zhǔn)普爾500指數(shù)為例,在2018年9月10日至9月21日期間共有10個交易日,自然也就有10個標(biāo)準(zhǔn)普爾500指數(shù)的收盤價。將這10個交易日的標(biāo)準(zhǔn)普爾500指數(shù)收盤價相加后除以交易天數(shù)10,就會得出這10個交易日標(biāo)準(zhǔn)普爾500指數(shù)收盤價的均值2,902.46。
日期 | 標(biāo)準(zhǔn)普爾500指數(shù)X | 均值 |
2018-9-10 | 2,877.13 | 2,902.46 |
2018-9-11 | 2,887.89 | |
2018-9-12 | 2,888.92 | |
2018-9-13 | 2,904.18 | |
2018-9-14 | 2,904.98 | |
2018-9-17 | 2,888.80 | |
2018-9-18 | 2,904.31 | |
2018-9-19 | 2,907.95 | |
2018-9-20 | 2,930.75 | |
2018-9-21 | 2,929.67 | |
合計 | 29,024.58 |
有了均值,下面就可以計算離均差,離均差就是一組數(shù)據(jù)中各個數(shù)值與該組數(shù)據(jù)均值的差異。用上述10個交易日的收盤價分別減去均值2,902.46,可以得出每一個收盤價的離均差。
日期 | 標(biāo)準(zhǔn)普爾500指數(shù)X | 均值M | 離均差=X-M |
2018-9-10 | 2,877.13 | 2,902.46 | (25.33) |
2018-9-11 | 2,887.89 | (14.57) | |
2018-9-12 | 2,888.92 | (13.54) | |
2018-9-13 | 2,904.18 | 1.72 | |
2018-9-14 | 2,904.98 | 2.52 | |
2018-9-17 | 2,888.80 | (13.66) | |
2018-9-18 | 2,904.31 | 1.85 | |
2018-9-19 | 2,907.95 | 5.49 | |
2018-9-20 | 2,930.75 | 28.29 | |
2018-9-21 | 2,929.67 | 27.21 |
離均差是計算方差的基礎(chǔ),將離均差乘方,相加求和后再除以10求平均值,得出來的結(jié)果就是這組數(shù)據(jù)的方差,方差衡量的也是一組數(shù)據(jù)中各個數(shù)值與該組數(shù)據(jù)均值的離散程度。在下表中,方差等于280.7405。方差的計算公式為
,其中x為樣本平均值,n為樣本的大小。
日期 | 標(biāo)準(zhǔn)普爾500指數(shù)X | 均值M | 離均差 | (離均差)^2=σ2 |
2018-9-10 | 2,877.13 | 2,902.46 | (25.33) | 641.51 |
2018-9-11 | 2,887.89 | (14.57) | 212.23 | |
2018-9-12 | 2,888.92 | (13.54) | 183.28 | |
2018-9-13 | 2,904.18 | 1.72 | 2.97 | |
2018-9-14 | 2,904.98 | 2.52 | 6.36 | |
2018-9-17 | 2,888.80 | (13.66) | 186.54 | |
2018-9-18 | 2,904.31 | 1.85 | 3.43 | |
2018-9-19 | 2,907.95 | 5.49 | 30.16 | |
2018-9-20 | 2,930.75 | 28.29 | 800.44 | |
2018-9-21 | 2,929.67 | 27.21 | 740.49 | |
合計 | 29,024.58 | 2,807.4055 | ||
280.7405 |
有了方差,標(biāo)準(zhǔn)差就迎刃而解了,因為標(biāo)準(zhǔn)差=方差的平方根,用σ表示。因此,前面這組數(shù)據(jù)的標(biāo)準(zhǔn)差=(280.7405)^(1/2)=16.7553。
且慢。。。以上的計算過程是基于該組數(shù)據(jù)是樣本數(shù)據(jù)的總體這一前提假設(shè),也就是說在標(biāo)準(zhǔn)普爾500指數(shù)的歷史上只有2018年9月10日至9月21日這10個交易日的收盤價。當(dāng)然這是不可能,因為這些數(shù)據(jù)只是抽樣數(shù)據(jù),是為了舉例說明而給定的樣本數(shù)據(jù)而不是數(shù)據(jù)的全部,因此需要對以上計算過程略作調(diào)整。上表中的和2,807.4055應(yīng)除以(10-1)而不是10,方差的結(jié)果變成311.9339,同樣標(biāo)準(zhǔn)差也就變成=(311.9339)^(1/2)=17.6617:
標(biāo)準(zhǔn)差又名均方差,是離均差平方的算術(shù)平均數(shù)的平方根,可用來衡量一組數(shù)據(jù)中各個數(shù)值與該組數(shù)據(jù)均值的離散程度。標(biāo)準(zhǔn)差的計算公式為
,其中x為樣本平均值,n為樣本的大小。標(biāo)準(zhǔn)差越大,說明該組數(shù)據(jù)中大部分?jǐn)?shù)據(jù)與均值的差異較大。均值相等的兩組數(shù)據(jù),標(biāo)準(zhǔn)差卻未必相同。比如,有A、B兩組數(shù)據(jù),如下表所示,這兩組數(shù)據(jù)的均值都等于5。
A | B |
3 | 4.8 |
5 | 5.2 |
4 | 4.3 |
6 | 5.7 |
7 | 5 |
但各數(shù)據(jù)偏離均值的程度是有差異的。。。,可以看到均值相等的兩組數(shù)據(jù)中,A組中各個數(shù)據(jù)之間的差異程度要高于B組。
小結(jié)一下:方差是標(biāo)準(zhǔn)差的平方,是離均差平方的和的均值。
通過以上的演示計算,可以看到離均差、方差、標(biāo)準(zhǔn)差衡量的都是某一組數(shù)據(jù)內(nèi)部各數(shù)值偏離均值的程度,通俗地講是自己跟自己比。但下面介紹的協(xié)方差比較的是兩組數(shù)據(jù)之間的差異程度。協(xié)方差的計算公式為其中
是兩個數(shù)據(jù)系列的樣本平均值,x、y為數(shù)據(jù)系列中的單個數(shù)據(jù),n為樣本的大小。
如果用于比較的兩組數(shù)據(jù)完全相同,那么其方差和協(xié)方差的計算結(jié)果是一致的,因此方差只是協(xié)方差的一個特例。
有了方差和協(xié)方差,下一步就可以計算相關(guān)系數(shù)了,公式為
其中是兩個數(shù)據(jù)系列的樣本平均值,x、y為數(shù)據(jù)系列中的單個數(shù)據(jù),n為樣本的大小。
需要注意,如果用協(xié)方差計算相關(guān)系數(shù),協(xié)方差中的x、y假設(shè)為全體數(shù)據(jù),因此協(xié)方差公式中的標(biāo)準(zhǔn)差計算時,需要除以n而不是n-1。
以西德克薩斯輕質(zhì)原油和標(biāo)準(zhǔn)普爾500指數(shù)為例,計算其收益率之間的相關(guān)系數(shù),收盤價取值日期為2018年9月10日至9月21日。
分布推導(dǎo)的結(jié)果與EXCEL自帶函數(shù)計算結(jié)果相符。