“到2020年,企業(yè)基于大數(shù)據(jù)分析的支出,將突破5000億美元,大數(shù)據(jù)在未來(lái)四年內(nèi),能幫到全球企業(yè)賺取約1.6萬(wàn)億美元的收入紅利。”
——國(guó)家知名數(shù)據(jù)公司IDC
大數(shù)據(jù)與喬布斯癌癥治療、奧巴馬大選連任成功、微軟大數(shù)據(jù)成功預(yù)測(cè)奧斯卡21項(xiàng)大獎(jiǎng)……這些知名大數(shù)據(jù)經(jīng)典案例淋漓盡致地體現(xiàn)了數(shù)據(jù)分析的重要作用。
早在20世紀(jì),數(shù)據(jù)分析崗就已運(yùn)用到企業(yè)業(yè)務(wù)層中,“啤酒與尿布”的故事就是一個(gè)經(jīng)典案例。在行業(yè)規(guī)模暴增的環(huán)境下,大數(shù)據(jù)領(lǐng)域整體人才缺口大,數(shù)據(jù)分析師成為大數(shù)據(jù)時(shí)代的寵兒,需求占比超過四成。
大數(shù)據(jù)浪潮的激流中,市場(chǎng)空間得到迅速釋放,企業(yè)對(duì)于大數(shù)據(jù)人才的需求也越來(lái)愈高,數(shù)據(jù)分析師則是這片翻騰浪花里的中流砥柱。然而對(duì)于很多人來(lái)說(shuō),“數(shù)據(jù)分析”這個(gè)新興技術(shù)還只是一個(gè)模糊概念,對(duì)于“數(shù)據(jù)分析師”這個(gè)職業(yè)還是在霧里看花。
數(shù)據(jù)分析到底是做什么的?數(shù)據(jù)分析師是火爆一時(shí),還是順應(yīng)而生?數(shù)據(jù)分析師要求的職業(yè)技能可以為此刻處于職業(yè)規(guī)劃期的你帶來(lái)哪些啟示呢?
本周推文小T將從是什么、做什么、需要什么、發(fā)展前景等角度分四個(gè)部分聊聊數(shù)據(jù)分析這個(gè)職位,讓你一探究竟:
一、什么是數(shù)據(jù)分析師?
首先,數(shù)據(jù)分析師到底是什么?我們需要明確下這個(gè)概念。
廣義的數(shù)據(jù)分析師主要分為兩大類:數(shù)據(jù)分析工程師和業(yè)務(wù)數(shù)據(jù)分析師。
業(yè)務(wù)數(shù)據(jù)分析師偏向于業(yè)務(wù)層面,主要基于統(tǒng)計(jì)方法通過對(duì)數(shù)據(jù)、數(shù)據(jù)指標(biāo)的解讀來(lái)解決商業(yè)問題??梢詣澐譃橐韵聨讉€(gè)層次:
業(yè)務(wù)監(jiān)控:診斷當(dāng)前業(yè)務(wù)是否正常?是否存在問題?業(yè)務(wù)發(fā)展是否達(dá)到預(yù)期(KPI)?如果沒有到達(dá)預(yù)期,主要問題在哪?是什么原因引起的?
建立分析體系:這些數(shù)據(jù)分析師已經(jīng)對(duì)業(yè)務(wù)有一定的理解,更多地是幫業(yè)務(wù)方建立一套分析體系,例如:營(yíng)銷活動(dòng)。分析師會(huì)告訴業(yè)務(wù)方,在活動(dòng)前你應(yīng)該收集分析哪些數(shù)據(jù),從而制定恰當(dāng)?shù)臓I(yíng)銷計(jì)劃。
行業(yè)未來(lái)發(fā)展的趨勢(shì)分析:這應(yīng)該是數(shù)據(jù)分析師的最高級(jí)別,有的公司叫做戰(zhàn)略分析師/商業(yè)分析師。這個(gè)層次的數(shù)據(jù)分析師站的更高,在行業(yè)、宏觀的層面進(jìn)行業(yè)務(wù)分析,幫助公司制定戰(zhàn)略發(fā)展計(jì)劃,并及時(shí)跟蹤、分析市場(chǎng)動(dòng)態(tài)。
數(shù)據(jù)分析工程師主要包括:算法工程師和建模工程師?;跈C(jī)器學(xué)習(xí)算法,利用算法和模型提高數(shù)據(jù)處理效率、挖掘數(shù)據(jù)價(jià)值、實(shí)現(xiàn)從數(shù)據(jù)到知識(shí)的轉(zhuǎn)換。一般指通過數(shù)據(jù)挖掘來(lái)解決具體問題。如:聚類分析,通過對(duì)于會(huì)員各種人口統(tǒng)計(jì)學(xué)、行為數(shù)據(jù)進(jìn)行分析,對(duì)會(huì)員進(jìn)行分類,從而指導(dǎo)公司精準(zhǔn)營(yíng)銷。
二、數(shù)據(jù)分析師是做什么?
我們先從一個(gè)故事講起,某養(yǎng)豬場(chǎng)廠長(zhǎng)告訴A分析師,我要看幾個(gè)數(shù)據(jù),你提取一下,一周后來(lái)給我匯報(bào)。
A分析師為了分析老板的目的,分析了去年他講話的內(nèi)容,也分析了他以往的年終匯報(bào)。甚至爬了豬總的朋友圈得知一個(gè)消息,豬總其實(shí)不想繼續(xù)增加擴(kuò)張,想減少投入,提高凈利,而且他對(duì)自動(dòng)化喂養(yǎng)很感興趣。那么問題來(lái)了?A分析師該如何思考?
A分析師需要從幾個(gè)關(guān)鍵的業(yè)務(wù)目標(biāo)出發(fā)
羅列出目標(biāo)影響因素有哪些?那么問題來(lái)了,因素這么多該如何去選???
這時(shí)候就需要數(shù)據(jù)支持,一般2種方式:
- 內(nèi)部數(shù)據(jù)去推送,驅(qū)動(dòng)因素影響的程度如何?這時(shí)候相關(guān)分析、層次分析、回歸分析等,給影響因素一個(gè)量化的標(biāo)準(zhǔn),找出核心驅(qū)動(dòng)因素;
- 外部數(shù)據(jù),采用座談、調(diào)研等方式確定公司各個(gè)業(yè)務(wù)部門對(duì)驅(qū)動(dòng)因素的鎖定。
其次就是驗(yàn)證推理提取核心的過程
A分析師需要整體分析豬的結(jié)構(gòu),比如公母比例、豬齡結(jié)構(gòu)、新生豬存活比例、豬市場(chǎng)價(jià)格變化等,也從市場(chǎng)分析了一些自動(dòng)化喂養(yǎng)設(shè)備的投入,計(jì)算ROI,這時(shí)候要系統(tǒng)性的去思考,進(jìn)行各類對(duì)比和梳理。
詳細(xì)的分析路徑不做過多闡述,具體參考下圖:
這時(shí)A分析師發(fā)現(xiàn)了什么?
- 豬的繁殖出現(xiàn)了問題,公豬占85%,母豬只有15%的比例。
- 豬食的浪費(fèi)問題,每天大概都有價(jià)值10000大洋的豬食被當(dāng)成垃圾清走。
- 豬的市場(chǎng)價(jià)格從8月初上升趨勢(shì)顯著,近期逐漸穩(wěn)定。
最后,A數(shù)據(jù)分析師給豬總呈現(xiàn)了三個(gè)數(shù)據(jù),這才是數(shù)據(jù)分析的核心。
- 繁殖問題,比例嚴(yán)重失調(diào),緊缺母豬。趁著目前母豬在市場(chǎng)的引入價(jià)格相對(duì)較低,建議引入500頭母豬,這是第一個(gè)數(shù)據(jù)。
- 自動(dòng)化喂養(yǎng)。通過分析ROI和采購(gòu)價(jià)格對(duì)比,預(yù)計(jì)采購(gòu)某廠家的自動(dòng)化喂養(yǎng),且可及時(shí)采集數(shù)據(jù)預(yù)測(cè)豬食投入,1年后自動(dòng)化喂養(yǎng)可節(jié)約80w成本。
- 豬齡結(jié)構(gòu)不平衡。成品豬較多,趁這波漲價(jià)建議加大銷售,騰出更多地方買入幼豬。預(yù)估明年5月份將提升40%的凈利。這是第三個(gè)數(shù)據(jù)。
——案例和圖片改自于“愛數(shù)圈”
概況來(lái)說(shuō),數(shù)據(jù)分析的日常工作主要包含以下幾個(gè)階段:
第一階段,問題識(shí)別與構(gòu)建
Step1:識(shí)別問題
Step2:回顧之前的發(fā)現(xiàn)
第二階段,定位問題,并給出解決方案
Step3:數(shù)據(jù)處理
Step4:搭建模型
Step5:分析數(shù)據(jù)
第三階段,傳達(dá)結(jié)果并推動(dòng)結(jié)果落地
Step6:傳達(dá)給相關(guān)方數(shù)據(jù)分析結(jié)果 并采取行動(dòng)
三、數(shù)據(jù)分析師的發(fā)展前景到底如何?
從20世紀(jì)90年代起,歐美國(guó)家開始大量培養(yǎng)數(shù)據(jù)分析師,直到現(xiàn)在,對(duì)數(shù)據(jù)分析師的需求仍然長(zhǎng)盛不衰,且有擴(kuò)張之勢(shì)。
美國(guó)勞工部曾預(yù)測(cè),2019年,數(shù)據(jù)分析師的需求量將增長(zhǎng)40%。在數(shù)據(jù)分析行業(yè)發(fā)展成熟的國(guó)家,90%的市場(chǎng)決策和經(jīng)營(yíng)決策都是通過數(shù)據(jù)分析研究確定的。
據(jù)數(shù)聯(lián)尋英發(fā)布《大數(shù)據(jù)人才報(bào)告》顯示,未來(lái)3-5年內(nèi)大數(shù)據(jù)人才的缺口將高達(dá)150萬(wàn)。根據(jù)中國(guó)商業(yè)聯(lián)合會(huì)數(shù)據(jù)分析專業(yè)委員會(huì)統(tǒng)計(jì),未來(lái)中國(guó)基礎(chǔ)性數(shù)據(jù)分析人才缺口將達(dá)到1400萬(wàn),而BAT等大型互聯(lián)網(wǎng)公司的招聘職位里,80%以上都在招大數(shù)據(jù)人才。進(jìn)入大數(shù)據(jù)行業(yè),也成了越來(lái)越多人實(shí)現(xiàn)職場(chǎng)高薪夢(mèng)的路徑之一。
基于TempoBI制作的“數(shù)據(jù)分析師”職業(yè)看板,數(shù)據(jù)來(lái)源:智聯(lián)招聘
在美國(guó),大數(shù)據(jù)分析師每年薪酬高達(dá)17.5萬(wàn)美元。
而國(guó)內(nèi)頂尖互聯(lián)網(wǎng)公司,大數(shù)據(jù)分析師的薪酬可能要比同一個(gè)級(jí)別的其他職位高20%至30%,且頗受企業(yè)重視。
國(guó)內(nèi)某大型招聘平臺(tái)給出的大數(shù)據(jù)分析師平均薪酬為:14.57K(取自1139份樣本),北京、深圳、上海、成都、廣州、杭州、西安、濟(jì)南、鄭州、南京為需求量前十的城市。
四、想要做一名數(shù)據(jù)分析師需要什么技能?
數(shù)據(jù)分析的一個(gè)核心詞語(yǔ)是“支撐決策”,它的本質(zhì)是商業(yè)分析,而不是技術(shù)和工具問題,大數(shù)據(jù)時(shí)代,數(shù)據(jù)價(jià)值和驅(qū)動(dòng)才是每個(gè)分析師應(yīng)該關(guān)注的問題。
想成為一個(gè)出色的分析師需要N多技能,哪些技能能夠讓你快速實(shí)現(xiàn)自己的目標(biāo),這才是學(xué)習(xí)數(shù)據(jù)分析應(yīng)該定位的。

懂業(yè)務(wù):從事數(shù)據(jù)分析工作的前提就會(huì)需要懂業(yè)務(wù),即熟悉行業(yè)知識(shí)、公司業(yè)務(wù)及流程,最好有自己獨(dú)到的見解,若脫離行業(yè)認(rèn)知和公司業(yè)務(wù)背景,分析就沒有太大的使用價(jià)值本質(zhì)上。技術(shù)是為業(yè)務(wù)服務(wù)的,技術(shù)落地的成功,首先從一份高質(zhì)量的業(yè)務(wù)需求開始。
懂?dāng)?shù)據(jù):數(shù)據(jù)分析本身是通過數(shù)據(jù),最終解決商業(yè)問題的過程。需要負(fù)責(zé)收集收據(jù)、構(gòu)建數(shù)據(jù)庫(kù)、搭建和運(yùn)行模型,并準(zhǔn)備高級(jí)類型的分析用來(lái)解釋已有數(shù)據(jù)中的模式,還會(huì)負(fù)責(zé)預(yù)測(cè)分析的基本部分。因此,一方面需要明確數(shù)據(jù)來(lái)源及數(shù)據(jù)指標(biāo)體系構(gòu)建等數(shù)據(jù)收集處理技術(shù);另一方面對(duì)于分析模型和算法功能等分析技術(shù)也要十分熟練。
懂代碼:數(shù)據(jù)分析師想要得到更遠(yuǎn)的發(fā)展需要具備一定的編程能力。對(duì)于數(shù)據(jù)分析的全流程來(lái)說(shuō),從數(shù)據(jù)獲取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析、結(jié)構(gòu)呈現(xiàn)等方面,都可以基于一定的編程語(yǔ)言來(lái)實(shí)現(xiàn)。了解Mysql,postgresql,sql server等數(shù)據(jù)庫(kù)原理,熟悉SQL,會(huì)R、python、C/C++等腳本語(yǔ)言對(duì)于數(shù)據(jù)分析工作非常重要。
此外,面對(duì)越來(lái)越龐大的數(shù)據(jù),單純的統(tǒng)計(jì)分析和代碼已經(jīng)不能滿足高效敏捷的數(shù)據(jù)分析需求,我們必須掌握并依靠強(qiáng)大的數(shù)據(jù)分析工具來(lái)幫助我們完成數(shù)據(jù)分析工作。
我們介紹了數(shù)據(jù)分析師所需要的硬實(shí)力和軟實(shí)力。那么我們就從硬實(shí)力和軟實(shí)力這兩個(gè)方向分別來(lái)分析什么專業(yè)可以從事大數(shù)據(jù)分析師。
硬實(shí)力:數(shù)據(jù)分析師需要學(xué)生有一定的數(shù)學(xué)、計(jì)算機(jī)背景,從這個(gè)出發(fā)點(diǎn)來(lái)說(shuō),數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)科學(xué)等專業(yè)可以從事數(shù)據(jù)分析工作。
不過,這三個(gè)專業(yè)的同學(xué)可以雖然可以處理大量數(shù)據(jù),并且擁有很強(qiáng)的數(shù)據(jù)分析能力,但是這類同學(xué)對(duì)于Business 和 Marketing缺乏了解,數(shù)據(jù)分析的結(jié)果對(duì)于企業(yè)并無(wú)太大收益。
軟實(shí)力:軟實(shí)力要求學(xué)生懂業(yè)務(wù)、懂管理,從這個(gè)出發(fā)點(diǎn)來(lái)說(shuō),市場(chǎng)營(yíng)銷、電子商務(wù)、經(jīng)濟(jì)學(xué)等專業(yè)畢業(yè)后也可以從事數(shù)據(jù)分析相關(guān)工作。
不過,這幾個(gè)專業(yè)在業(yè)務(wù)方面可能專業(yè)度非常高,但是缺點(diǎn)也是非常明顯的:缺乏很強(qiáng)的數(shù)學(xué)和計(jì)算機(jī)背景,在實(shí)際操作中缺乏相關(guān)的專業(yè)技能。
大數(shù)據(jù)時(shí)代,培養(yǎng)既懂技術(shù)又懂業(yè)務(wù)的復(fù)合型人才是時(shí)代趨勢(shì)所致。
數(shù)據(jù)分析師作為大數(shù)據(jù)生態(tài)里邊最靠近業(yè)務(wù)的一環(huán),重要性不言而喻!沒有數(shù)據(jù)分析師,數(shù)據(jù)的價(jià)值無(wú)從談起,沒有數(shù)據(jù)分析師,數(shù)據(jù)存儲(chǔ)、ETL都是成本,無(wú)法產(chǎn)生利潤(rùn),而數(shù)據(jù)分析師可以通過數(shù)據(jù)影響決策,最終影響業(yè)務(wù)并創(chuàng)造更多利潤(rùn)。