欧美40老熟妇色xxxxx,免费+国产+在线观看,末成年女a∨片一区二区,久久伊人色av天堂九九,免费中文熟妇在线影片

美林?jǐn)?shù)據(jù)
ABOUT US
美林?jǐn)?shù)據(jù)技術(shù)股份有限公司(簡稱:美林?jǐn)?shù)據(jù),NEEQ:831546)是國內(nèi)知名的數(shù)據(jù)治理和數(shù)據(jù)分析服務(wù)提供商。

【數(shù)據(jù)挖掘算法分享】機(jī)器學(xué)習(xí)平臺(tái)——回歸模型評(píng)估

2022-12-12 16:35:00
回歸模型評(píng)估是機(jī)器學(xué)習(xí)平臺(tái)中用來評(píng)價(jià)一個(gè)回歸任務(wù)中的模型表現(xiàn)。比較一種回歸一組參數(shù)、不同參數(shù)組合或者多種回歸算法之間的分析性能,檢驗(yàn)回歸模型的準(zhǔn)確性和可靠性。
主要包含以下幾種指標(biāo):
假設(shè)y_i是第i個(gè)樣本的真實(shí)值,機(jī)器學(xué)習(xí)平臺(tái)為對(duì)第i個(gè)樣本的預(yù)測值,其中i=1,2,…,n,n為樣本個(gè)數(shù)。

1、整體量化指標(biāo)

其中n為樣本數(shù),p為回歸方程自變量個(gè)數(shù),AIC(赤信息量)和BIC(貝葉斯信息量)作為回歸模型的選擇標(biāo)準(zhǔn),兩個(gè)值越小代表模型越好。
R方描述了由自變量的線性函數(shù)值所能反應(yīng)的y的總變化量的比例,R方越大自變量與因變量的線性關(guān)系越顯著,模型越好

其中
SSR=SST-SSE
自變量個(gè)數(shù)的增加將影響到因變量中被回歸方程所解釋的變異比例,即會(huì)影響判定系數(shù)R方的大小,當(dāng)增加變量時(shí),會(huì)使殘差平方和減少,從而使R方變大,也就是說,如果模型中增加一個(gè)自變量,即使這個(gè)自變量在統(tǒng)計(jì)上并不顯著,R方也會(huì)變大,因此為避免增加自變量而高估R方,因此提出調(diào)整R方,記為〖Ra〗^2
D-W檢驗(yàn)又稱杜賓瓦特森檢驗(yàn),D-W檢驗(yàn)用于檢驗(yàn)隨機(jī)誤差項(xiàng)具有一階自回歸形式的序列相關(guān)問題,也即殘差的自相關(guān)檢驗(yàn),D-W取值一般在0-4之間:
D-W值接近于0表示殘差存在正相關(guān);
D-W值接近于4表示殘差存在負(fù)相關(guān);
D-W值近似于2 表示殘差不存在相關(guān)性,此時(shí)回歸模型較好。
2、誤差指標(biāo):
誤差序列為
誤差方差
均方誤差
均方根誤差
平均絕對(duì)誤差
最大絕對(duì)誤差
最小絕對(duì)誤差
平均相對(duì)誤差
最大相對(duì)誤差
最小相對(duì)誤差=
其中回歸主要參考的誤差為均方誤差,平均絕對(duì)誤差其值越小代表模型越好。
4、方差分析指標(biāo)
因變量的Y的觀測值之所以有差異,是由以下面兩個(gè)原因引起的:一是通過函數(shù),當(dāng)取不同的值引起Y值的變化;二是由其他未加考慮的因素以及隨機(jī)因素所產(chǎn)生的影響。下面將的總變化量分解成上述兩部分,通過比較這兩部分的相對(duì)大小,分析的函數(shù)所能反應(yīng)總變化量的程度,以考察Y與的之間的關(guān)系是否顯著。
,則的變化量可以用所謂的總離差平方和(Total Sum of Squares)度量,即用

殘差平方和或稱為誤差平方和(Error Sum of Squares)

回歸平方和(Regression Sum of Squares)

其中SST= SSE + SSR
F檢驗(yàn)是用于回歸系數(shù)的顯著性檢驗(yàn)。

其中MSR=SSR/(p-1),MSE=SSE/(n-p)分別稱為均方回歸和均方殘差,p-1稱為SSR的自由度,它等于回歸模型中自變量的個(gè)數(shù);n-p稱為SSE的自由度,它等于樣本容量n與回歸模型中未知參數(shù)p之差;進(jìn)一步成,(p-1)+(n-p)=n-1為SST的自由度,可以證明當(dāng)H_0為真的,有
F~F(p-1,n-p)
其中F(p-1,n-p)表示自由度為p-1和n-p的F分布,由樣本所求得的統(tǒng)計(jì)量F的觀測值為F_0,假設(shè)檢驗(yàn)的p值為

F值越大說明自變量的線性函數(shù)值所解釋y的變化量越多,因變量與自變量關(guān)系越顯著。
4、圖形指標(biāo):
殘差圖是指以殘差為縱坐標(biāo),以任何其他有關(guān)量的值為橫坐標(biāo)的散點(diǎn)圖。通過考察各類殘差圖可以對(duì)誤差項(xiàng)分布的正態(tài)性,等方差性及回歸關(guān)系等假設(shè)做出會(huì)直觀檢驗(yàn)。以樣本為橫坐標(biāo),殘差為縱坐標(biāo),如果殘差隨著時(shí)間呈規(guī)律性變化,則殘差存在正相關(guān)或者負(fù)相關(guān)。當(dāng)描繪的點(diǎn)圍繞殘差等于0的直線上下隨機(jī)散布,說明回歸直線對(duì)原觀測值擬合情況良好。否則回歸直線對(duì)原觀測值擬合不理想。
QQ圖是殘差正態(tài)性檢驗(yàn),若QQ圖上的點(diǎn)近似地在一條直線上,可以認(rèn)為樣本數(shù)據(jù)來自正態(tài)總體,QQ圖的點(diǎn)如果不在一條直線上,則誤差的分布與正態(tài)分布有較大的偏離,回歸模型效果較差。


服務(wù)熱線
400-608-2558
咨詢熱線
15502965860
美林?jǐn)?shù)據(jù)
微信掃描二維碼,立即在線咨詢