關(guān)聯(lián)分析是數(shù)據(jù)分析領(lǐng)域中的重要技術(shù)之一,它可以揭示事物之間的相互依賴(lài)和關(guān)聯(lián)性。通過(guò)關(guān)聯(lián)分析,我們可以發(fā)現(xiàn)在同一事件中出現(xiàn)頻率較高并具有相關(guān)性的事物,從而能夠預(yù)測(cè)其中一個(gè)事物通過(guò)其他事物的出現(xiàn)。一個(gè)經(jīng)常用到關(guān)聯(lián)分析的例子就是購(gòu)物籃分析。通過(guò)觀察哪些商品經(jīng)常同時(shí)被顧客購(gòu)買(mǎi),商店能夠更好地了解用戶(hù)的購(gòu)買(mǎi)行為,從而做出針對(duì)性的商品搭配和營(yíng)銷(xiāo)策略。
關(guān)聯(lián)分析的流程通常包括數(shù)據(jù)接入、設(shè)置角色和建立模型等步驟。首先,我們需要接入結(jié)構(gòu)化數(shù)據(jù),并確保自變量的數(shù)據(jù)類(lèi)型為字符型,因?yàn)殛P(guān)聯(lián)算法要求自變量為離散型數(shù)據(jù)。如果接入的自變量數(shù)據(jù)不符合關(guān)聯(lián)分析的要求,我們可以通過(guò)屬性變化節(jié)點(diǎn)進(jìn)行數(shù)據(jù)類(lèi)型轉(zhuǎn)換或重新接入數(shù)據(jù),以滿(mǎn)足關(guān)聯(lián)分析的需求。
接下來(lái),我們需要設(shè)置角色節(jié)點(diǎn)來(lái)確定關(guān)聯(lián)分析的自變量。關(guān)聯(lián)算法中必須設(shè)置自變量,并且自變量必須為離散型數(shù)據(jù),不支持設(shè)定因變量。在設(shè)置角色節(jié)點(diǎn)之前,我們可以根據(jù)實(shí)際業(yè)務(wù)和數(shù)據(jù)情況進(jìn)行數(shù)據(jù)的預(yù)處理工作,包括數(shù)據(jù)的清洗、集成、轉(zhuǎn)換、離散、歸約、特征選擇和提取等,以使數(shù)據(jù)符合挖掘建模的標(biāo)準(zhǔn)。
在完成數(shù)據(jù)接入和角色設(shè)置后,我們可以根據(jù)數(shù)據(jù)分析方案和預(yù)處理后的業(yè)務(wù)數(shù)據(jù)來(lái)構(gòu)建關(guān)聯(lián)模型。平臺(tái)內(nèi)置了三種關(guān)聯(lián)算法,包拽使用,并且可以配置相應(yīng)的模型參數(shù),包括Apriori算法、FPGrowth算法和序列算法。這些算法能夠幫助我們找出屬性之間的關(guān)聯(lián)規(guī)則,并提供結(jié)果的可視化。
當(dāng)流程構(gòu)建完成并成功執(zhí)行后,我們可以進(jìn)入洞察頁(yè)面,點(diǎn)擊【Apriori】來(lái)查看分析結(jié)果。
我們可以指定關(guān)聯(lián)規(guī)則的前項(xiàng)和后項(xiàng),系統(tǒng)會(huì)輸出給定規(guī)則的結(jié)果。同時(shí),我們還能通過(guò)網(wǎng)絡(luò)圖來(lái)觀察屬性之間的相關(guān)性。網(wǎng)絡(luò)圖中的連線(xiàn)代表兩個(gè)屬性之間的關(guān)聯(lián)關(guān)系,線(xiàn)的粗細(xì)則表示關(guān)系的強(qiáng)弱程度。
通過(guò)以上的關(guān)聯(lián)分析流程和分析結(jié)果,我們能夠揭示事物之間的關(guān)聯(lián)性和依賴(lài)性。這些發(fā)現(xiàn)有助于我們深入了解數(shù)據(jù),并為業(yè)務(wù)決策提供有力的支持。關(guān)聯(lián)分析的應(yīng)用不僅局限于購(gòu)物籃分析,在市場(chǎng)研究、推薦系統(tǒng)、風(fēng)險(xiǎn)分析等領(lǐng)域也有廣泛的應(yīng)用。