如何讓不懂代碼的小白也能復用Python編碼成果?機器學習平臺來了!
2022-06-16 18:21:15
次
Tempo小課堂—Python擴展編程功能實用技巧第二篇來咯~
在上一期Tempo小課堂| 安利3個被數(shù)據(jù)分析師夸爆的Python編程小功能!中小T給大家介紹了如何在Tempo平臺擴展編程中通過3個提高Python編程易用性的小功能,來彌補Python原生編程在企業(yè)實際數(shù)據(jù)分析場景中的不足。
但企業(yè)的業(yè)務數(shù)據(jù)化轉(zhuǎn)型,當然不僅僅只和具備編碼能力的專業(yè)數(shù)據(jù)分析人員有關。在實際的企業(yè)業(yè)務數(shù)據(jù)分析場景中,比如我們Tempo大數(shù)據(jù)分析平臺的大量用戶,其實都是一線的普通業(yè)務人員。
這些“小白”普遍對于算法語言(如Python、R、Java、Scala等)并不了解,通常只能通過平臺內(nèi)自帶的算法節(jié)點以拖拽的方法實現(xiàn)建模分析。
隨著業(yè)務數(shù)據(jù)分析維度的加深,往往就會出現(xiàn)一個尷尬的情況:
?需要處理的業(yè)務數(shù)據(jù)分析情況較為復雜,平臺內(nèi)自帶的算法節(jié)點不夠用了,需要企業(yè)專業(yè)數(shù)據(jù)分析人員專門去開發(fā)業(yè)務相關的算法才能繼續(xù)推進。
?算法以算法語言(比如Python語言)形式呈現(xiàn),業(yè)務人員既看不懂也不會用,新開發(fā)的算法需要封裝成算法節(jié)點的形式,業(yè)務人員才能夠上手使用。
?系統(tǒng)管理員對業(yè)務涉及的相關算法也不夠了解,無法快速完成對整個算子相關說明的封裝過程,且系統(tǒng)管理員的權限往往只存在于少部分人員,對于業(yè)務用戶和系統(tǒng)管理員雙方的溝通成本和工作量都比較大,過程繁瑣。
這時,我們就會發(fā)現(xiàn),受限于編碼等專業(yè)技術門檻,在面對一些更為復雜的業(yè)務數(shù)據(jù)分析需求時,普通業(yè)務人員還是沒有辦法深度參與到分析過程中。
因此為了避免此類問題,很多企業(yè)希望將封裝算法的任務直接下發(fā)到與業(yè)務相關的算法設計人員,然后由系統(tǒng)管理員進行審核并管理,系統(tǒng)管理員只需審核通過或不通過,若審核不通過,則只需填寫審核原因,告知項目組的相關人員即可。
這樣一來不僅可以將數(shù)據(jù)平臺系統(tǒng)管理員從繁瑣、復制的自定義算法上傳、封裝、維護的重復性工作中釋放出來,還可以簡化相關溝通流程,讓業(yè)務相關人員可以直接對接相關需求,提高整體工作效率。

便捷點選操作 快速實現(xiàn)算法封裝
為了滿足大家在實際工作場景中的需求,Tempo平臺支持將Python編程節(jié)點發(fā)布為自定義算法,通過簡單幾步點選操作,即可快速將原創(chuàng)算法轉(zhuǎn)換為自定義算法節(jié)點,方便快捷。
以邏輯回歸算法為例,若用戶已經(jīng)在Python編程實現(xiàn)了邏輯回歸的主要代碼,需要將其封裝為一個自定義算法,算子的配置界面中支持用戶設置正則化參數(shù)、最大迭代次數(shù)、懲罰函數(shù)類型3個參數(shù),如下圖所示。
根據(jù)用戶角色的不同,具體算法封裝流程稍有不同。
普通設計用戶
在Tempo AI—挖掘分析—設計區(qū)—建模—Python編程節(jié)點,支持直接將Python編程的代碼發(fā)布為自定義算法;
參數(shù)配置
執(zhí)行流程
設置好參數(shù)后,就可以進行流程執(zhí)行。節(jié)點執(zhí)行成功后,在節(jié)點上右鍵,則支持“發(fā)布為自定義算法”功能。
自定義算法配置
需要經(jīng)過基本信息(填寫算法名稱、算法描述、上傳算法圖標)、元信息配置(設置輸入和輸出端口,輸入端口需要上傳數(shù)據(jù)集,輸出端口需要設置元信息)、測試(保證封裝的自定義算法可以正常使用)3個步驟,可提交“發(fā)布為自定義算法”的審核。
系統(tǒng)管理員
在Tempo AI-系統(tǒng)管理—挖掘平臺配置—算法管理—自定義算法管理—待審核中,可審核通過或不通過;
點擊“審核”,可以選擇讓該算法通過或不通過,若通過,則需要選擇該算法的目錄層級,則可進行發(fā)布等操作。若不通過,則需要填寫原因。審核結(jié)果都會以消息的方式提醒用戶。
此外,系統(tǒng)管理員還可對待審核、通過、未通過的算法進行查看、刪除操作。查看算子時,支持查看算子的基本信息、代碼、參數(shù)配置、輸入和輸出端口信息。
知識成果統(tǒng)一管理 提高工作效率
這個功能也能夠幫助企業(yè)完善算法成果的日常管理和知識資產(chǎn)的沉淀積累。
舉個例子,在企業(yè)或項目中,代碼偏好人員的算法成果,往往以代碼形式散落在個人電腦重,企業(yè)無法統(tǒng)一管理,甚至不清楚內(nèi)部有多少成果,分別能夠解決哪方面的業(yè)務問題。
那么當人員發(fā)生變動,算法成果就脫離企業(yè)的掌控了,當遇到相似的場景分析需求時,往往無法順利復用已有算法成果,還是要從零開始梳理業(yè)務,進行重復性的代碼開發(fā)等,無形中造成資源、成本的浪費。
而通過Tempo平臺的代碼快速轉(zhuǎn)化為自定義算法的小功能,企業(yè)在日常項目管理中就可以輕松解決上述問題,還能在企業(yè)知識資產(chǎn)的積累過程中實現(xiàn)以下價值:
01、可以解決代碼化分析及管理的難題,并與已有算法功能可交叉使用,無縫融合,更靈活。
02、可以將內(nèi)部已有歷史算法成果集成到平臺,統(tǒng)一管理及維護,進行算法成果沉淀,形成企業(yè)獨家內(nèi)容資產(chǎn)。
03、在平臺形成封裝好的算法,業(yè)務人員可查看并直接拖拽使用,實現(xiàn)成果分享、資源復用,提升分析效率,降低學習門檻。
課后總結(jié)
今天的Tempo小課堂中,小T主要給大家介紹了如何通過Tempo平臺中的Python擴展編程功能簡化算法封裝節(jié)點流程,提高算法成果復用、知識沉淀相關工作的效率。
下一期,小T將會繼續(xù)給大家介紹,如何通過Tempo大數(shù)據(jù)分析平臺中的Python擴展編程功能,實現(xiàn)Python編程的性能提升,敬請期待!