欧美40老熟妇色xxxxx,免费+国产+在线观看,末成年女a∨片一区二区,久久伊人色av天堂九九,免费中文熟妇在线影片

美林?jǐn)?shù)據(jù)
ABOUT US
美林?jǐn)?shù)據(jù)技術(shù)股份有限公司(簡稱:美林?jǐn)?shù)據(jù),NEEQ:831546)是國內(nèi)知名的數(shù)據(jù)治理和數(shù)據(jù)分析服務(wù)提供商。

如何快速完成一個數(shù)據(jù)挖掘分析項(xiàng)目?—企業(yè)數(shù)據(jù)挖掘成功之道(方法篇)

2019-06-13 15:49:03
引子:通過上周的文章,大家應(yīng)該已經(jīng)對“數(shù)據(jù)挖掘”有了一個更清晰全面的認(rèn)識。哪些在具體業(yè)務(wù)中,如何有效應(yīng)用,快速落地一個項(xiàng)目應(yīng)用實(shí)踐呢?今天我們將以一個行業(yè)實(shí)際案例為主,依據(jù)“數(shù)據(jù)挖掘方法論”【詳細(xì)可參閱歷史文章《數(shù)據(jù)挖掘方法論》】為大家詳細(xì)解析,如何快速完成一個項(xiàng)目應(yīng)用實(shí)踐,通過數(shù)據(jù)挖掘技術(shù)和方法,獲取業(yè)務(wù)應(yīng)用價值。

數(shù)據(jù)挖掘方法論為開展數(shù)據(jù)挖掘項(xiàng)目提供了一套完整的、高效的、質(zhì)量可控的項(xiàng)目管理過程。CRISP-DM方法論將一個數(shù)據(jù)挖掘項(xiàng)目的生命周期分為六個階段,其中包括業(yè)務(wù)理解(business understanding),數(shù)據(jù)理解 (data understanding),數(shù)據(jù)準(zhǔn)備(data preparation),建立模型(modeling),評估模型(evaluation)和結(jié)果部署(deployment)。
 企業(yè)數(shù)據(jù)挖掘成功之道
那么,在一個實(shí)際的數(shù)據(jù)挖掘工作中,如何落地實(shí)踐這套挖掘方法論呢?下面我們將以“公募基金精準(zhǔn)營銷”為例,詳細(xì)介紹數(shù)據(jù)挖掘項(xiàng)目開展流程和步驟【建模工具采用:TempoAI完成】。

階段一:業(yè)務(wù)理解(business understanding)
業(yè)務(wù)背景:券商發(fā)行的公募基金產(chǎn)品,傳統(tǒng)的營銷方式為外呼人員電話營銷。傳統(tǒng)電話營銷方式存在的問題主要有兩點(diǎn):
  • 工作量巨大,因?yàn)槭怯萌靠蛻裘麊蝸泶螂娫挔I銷:開展10萬人次外呼營銷任務(wù),要4個外呼人員1年的工作量;
  • 意向成功率過低,平均接通率54%,意向成功率18.09%左右。 數(shù)據(jù)挖掘業(yè)務(wù)痛點(diǎn)
涉及部門:信息技術(shù)部、營銷部、客服部(外呼中心)
業(yè)務(wù)目標(biāo):提升意向成功率,優(yōu)化外呼營銷策略,切實(shí)增加意向成功用戶數(shù),提高投入產(chǎn)出率。
分析方案:
  • 分類預(yù)測:構(gòu)建潛客預(yù)測模型,預(yù)測高概率購買公募基金的潛在客戶,為券商提供精準(zhǔn)營銷客戶名單。
  • 分析成果驗(yàn)證:將分析產(chǎn)生的預(yù)測會夠買的人員名單,提供給外呼中心,進(jìn)行外呼推薦公募基金產(chǎn)品,最終將推薦名單外呼和傳統(tǒng)的外呼效果進(jìn)行比對,對比外呼成功率,從而判斷分析成果是否顯著。
階段二:數(shù)據(jù)理解 (data understanding)
收集的數(shù)據(jù)表信息包括:
•借記卡用戶基本信息表
•信用卡用戶基本信息表、用戶狀態(tài)標(biāo)識代碼表
•信用卡卡片信息表、信用卡卡片代碼表、卡片狀態(tài)標(biāo)識代碼表
•信用卡交易流水信息表
•用戶的業(yè)務(wù)信息表
•公共信息表:商戶代碼MCC碼表、用戶職業(yè)代碼表等
•歷史外呼反饋信息表
•信用卡違約狀態(tài)及未還款的歷史數(shù)據(jù)
•設(shè)備信息
針對收集到的數(shù)據(jù)信息,進(jìn)行數(shù)據(jù)理解:
用戶特征探索:待營銷用戶群體的分布形態(tài),營業(yè)部分布,性別分布,風(fēng)險等級分布及業(yè)務(wù)開通情況。
 用戶特征數(shù)據(jù)挖掘

階段三:數(shù)據(jù)準(zhǔn)備(data preparation)
數(shù)據(jù)準(zhǔn)備工作包括為建模工作準(zhǔn)備數(shù)據(jù)的選擇、轉(zhuǎn)換、清洗、構(gòu)造、整合及格式化等多種數(shù)據(jù)預(yù)處理工作。這里主要進(jìn)行了數(shù)據(jù)指標(biāo)體系設(shè)計(jì)、建模所需字段的生成、缺失值處理等。
TempoAI數(shù)據(jù)處理:
 TempoAI數(shù)據(jù)處理

階段四:建立模型(modeling)
基于用戶基本信息如風(fēng)險等級、開戶年限、年齡等,資產(chǎn)信息如總資產(chǎn)、近一年最大資產(chǎn)、近半年日均資產(chǎn)等,產(chǎn)品交易信息如股票交易次數(shù)、近兩年最后買公墓基金天數(shù)、近半年理財(cái)持有比例,構(gòu)建用戶公募基金潛客預(yù)測模型,基于該模型,可以預(yù)測高概率購買公募基金的潛在客戶,為券商提供精準(zhǔn)營銷客戶名單。在TempoAI中構(gòu)建的建模流程如下:
 TempoAI數(shù)據(jù)建模

建模步驟說明:
(1)讀取數(shù)據(jù)
拖入關(guān)系數(shù)據(jù)庫輸入節(jié)點(diǎn),選擇數(shù)據(jù)源,選擇購買公募基金用戶的歷史數(shù)據(jù)集,完成數(shù)據(jù)讀取。
(2)設(shè)置角色
在設(shè)置角色節(jié)點(diǎn),選擇參與模型訓(xùn)練的變量設(shè)置自變量(影響因素)和因變量(預(yù)測變量)。
自變量為:用戶基本信息/資產(chǎn)信息及產(chǎn)品交易信息等字段;
因變量為:flag(是否購買公募基金,1代表購買,0代表不夠買)。
(3)數(shù)據(jù)拆分
為了保證模型的可靠性,我們一般將原始數(shù)據(jù)集拆分成兩個或三個數(shù)據(jù)集,這里我們拆分為兩部分:一部分用于訓(xùn)練模型,另外一部分用于測試模型的泛化能力(預(yù)測能力)。如下圖所示,70%的數(shù)據(jù)作為訓(xùn)練集 30%的數(shù)據(jù)作為測試集。
(4)梯度提升決策樹
     選擇一個分類算法,構(gòu)建分類模型,這里我們選擇梯度提升決策樹算法,將數(shù)據(jù)拆分后的訓(xùn)練集接入算法,參數(shù)設(shè)置如下:
 決策樹分析
(5)訓(xùn)練集分類評估
將算法的M端口和D端口連接一個分類評估節(jié)點(diǎn),評估訓(xùn)練集的預(yù)測效果。分類評估節(jié)點(diǎn)參數(shù)設(shè)置如下:
 分類評估
(6)模型利用
將算法輸出的M端口連接模型利用節(jié)點(diǎn),同時將數(shù)據(jù)拆分后的測試集D端口接入模型利用,這里將利用梯度提升決策樹產(chǎn)生的模型對測試數(shù)據(jù)集進(jìn)行預(yù)測。
(7)測試集分類評估
將模型利用輸出的M端口和D端口連接一個分類評估節(jié)點(diǎn),評估測試集的預(yù)測效果。
(8)模型輸出
將訓(xùn)練好的模型輸出到模型庫。
(9)連接END端點(diǎn),完成流程構(gòu)建,點(diǎn)擊執(zhí)行。

階段五:評估模型(evaluation)

評估模型,指在此階段,需要從技術(shù)層面判斷模型效果以及從業(yè)務(wù)層面判斷模型在實(shí)際商業(yè)環(huán)境當(dāng)中的實(shí)用性。
流程執(zhí)行成功后,可在洞察頁面,查看流程執(zhí)行的結(jié)果:
 評估模型

這里我們主要看分類模型評估結(jié)果及分類模型預(yù)測結(jié)果。
點(diǎn)擊“梯度提升決策樹節(jié)點(diǎn)”查看分類模型內(nèi)容及預(yù)測結(jié)果數(shù)據(jù)集:
下圖為模型內(nèi)容:決策樹及層級說明信息
 決策樹分類
下圖為預(yù)測結(jié)果數(shù)據(jù)集信息:可從業(yè)務(wù)角度評估預(yù)測結(jié)果的合理性。
 數(shù)據(jù)挖掘評估預(yù)測

點(diǎn)擊“分類評估節(jié)點(diǎn)”查看分類評估結(jié)果(包括訓(xùn)練集評估和測試集評估)
訓(xùn)練集評估結(jié)果:包括模型的準(zhǔn)確率、混淆矩陣、ROC/PR、Lift曲線、Gains曲線、基尼系數(shù) 、K-S曲線。綜合各評估指標(biāo)及曲線,模型評估效果較好。
 分類評估節(jié)點(diǎn)

測試集評估結(jié)果:如下圖
 分類算法評估結(jié)果

階段六:結(jié)果部署(deployment)
經(jīng)過模型訓(xùn)練和模型測試,得到了比較理想的預(yù)測模型。需要將模型的成果書面化,結(jié)合前幾個階段進(jìn)行總結(jié),形成數(shù)據(jù)“分析報(bào)告”。如果涉及到工程化應(yīng)用,還需要將模型發(fā)布成不同方式(調(diào)度、同步/異步服務(wù)API、實(shí)時服務(wù)等),供其它業(yè)務(wù)系統(tǒng)進(jìn)行整合,形成最終的決策應(yīng)用系統(tǒng),需要“部署應(yīng)用”。
分析報(bào)告
TempoAI洞察頁面,支持直接導(dǎo)出Word格式的完整挖掘流程建模分析報(bào)告。如下圖所示:
 TempoAI評估結(jié)果
部署應(yīng)用
構(gòu)建一個預(yù)測流程,利用訓(xùn)練好的模型,然后把預(yù)測流程發(fā)布,并部署為應(yīng)用。
(1)構(gòu)建預(yù)測流程
將要預(yù)測的數(shù)據(jù)作為數(shù)據(jù)源,讀取并利用已輸出的分類預(yù)測模型,構(gòu)建預(yù)測流程。如下所示:
 TempoAI建模流程
(2)發(fā)布預(yù)測流程
進(jìn)入“部署”“-“發(fā)布”,將預(yù)測流程發(fā)布。
(3)構(gòu)建調(diào)度
在“部署”-“應(yīng)用”,將已發(fā)布的預(yù)測流程構(gòu)建調(diào)度任務(wù)。平臺提供任務(wù)調(diào)度器,可配置調(diào)度任務(wù),將的一個或多個流程在指定的日期范圍內(nèi)按一定的頻率定期執(zhí)行,完成預(yù)測任務(wù)。如下所示:
 TempoAI模型任務(wù)調(diào)度
(4)構(gòu)建服務(wù)
在“部署”-“應(yīng)用”,用戶可將已發(fā)布流程構(gòu)建一個服務(wù),根據(jù)流程數(shù)據(jù)源的不同,分為同步服務(wù)、異步服務(wù)和流服務(wù)。同步服務(wù):支持第三方系統(tǒng)通過Thrift/Rest調(diào)用流程,實(shí)時返回預(yù)測結(jié)果。異步服務(wù):支持第三方系統(tǒng)通過Rest調(diào)用流程,按照指定頻率定期執(zhí)行,完成模型構(gòu)建或數(shù)據(jù)預(yù)測,預(yù)測結(jié)果輸入到指定數(shù)據(jù)庫。流服務(wù):開啟服務(wù),當(dāng)Kafka的隊(duì)列中有消息時,即可執(zhí)行流程,完成對于流式數(shù)據(jù)的實(shí)時處理。
(5)服務(wù)調(diào)用
第三方系統(tǒng)可調(diào)用相應(yīng)的API,通過在第三方系統(tǒng)輸入?yún)?shù),調(diào)用服務(wù),并返回服務(wù)的執(zhí)行狀態(tài)。
調(diào)用方式:打開該服務(wù)的測試頁面,“下載示例代碼”、“下載SDK”。將下載的示例代碼文件中的代碼段復(fù)制粘貼,即可通過運(yùn)行代碼調(diào)用該異步服務(wù)。調(diào)用接口可供營銷業(yè)務(wù)系統(tǒng)進(jìn)行整合,形成最終的決策應(yīng)用系統(tǒng),給營銷外呼中心提供營銷名單,指導(dǎo)實(shí)際業(yè)務(wù)的開展。
(6)部署結(jié)果驗(yàn)證
將預(yù)測分析產(chǎn)生的預(yù)測夠買人員名單,提供給外呼中心,進(jìn)行外呼推薦公募基金產(chǎn)品,最終將推薦名單外呼和傳統(tǒng)的外呼效果進(jìn)行比對,對比結(jié)果如下:推薦外呼11天,撥打5877通電話(占傳統(tǒng)外呼36.01%),得到意向客戶數(shù)1664個,是傳統(tǒng)外呼開展32天的整體意向客戶數(shù)的1.08倍。結(jié)合營銷活動的成本和成果兩個方面考慮,綜合效果提升3.14倍。

TempoAI數(shù)據(jù)挖掘結(jié)果

服務(wù)熱線
400-608-2558
咨詢熱線
15502965860
美林?jǐn)?shù)據(jù)
微信掃描二維碼,立即在線咨詢