美林?jǐn)?shù)據(jù)技術(shù)專家團(tuán)隊 | 隱私計算帶動數(shù)據(jù)安全應(yīng)用
2021-08-06 19:04:17
次
你有沒有聽到這樣的事情:經(jīng)常上熱搜的“大數(shù)據(jù)殺熟”、手機好像在監(jiān)聽消費者的喜好、外賣小哥被困在算法里停不下來……
仿佛有一雙眼睛在無時無刻的盯著我們的一舉一動,其實這些都是隱私泄露。不管是對個人也好,對企業(yè)也好,泄露隱私都會讓我們感到毛骨悚然。
近年來,數(shù)據(jù)安全事件頻繁發(fā)生,數(shù)據(jù)安全威脅日益嚴(yán)峻。而這一切的根本原因在于,數(shù)據(jù)所帶來的巨大潛在利益,促使不法之徒肆無忌憚的收集和使用我們的隱私數(shù)據(jù)。
2021年9月起,正式施行的《中華人民共和國數(shù)據(jù)安全法》就是為了規(guī)范數(shù)據(jù)處理活動,保障數(shù)據(jù)安全,促進(jìn)數(shù)據(jù)開發(fā)利用,保護(hù)個人、組織的合法權(quán)益,維護(hù)國家主權(quán)、安全和發(fā)展利益而制定的專項法律。
數(shù)據(jù)作為數(shù)字經(jīng)濟(jì)下最重要的生產(chǎn)要素,在保證數(shù)據(jù)安全的同時,更要發(fā)展數(shù)據(jù)。該如何兼顧發(fā)展與安全,平衡效益與風(fēng)險,在保障數(shù)據(jù)安全的前提下,挖掘數(shù)據(jù)價值?
數(shù)據(jù)可用不可見
由于競爭及政策等原因,“數(shù)據(jù)孤島”現(xiàn)象明顯
眾多企業(yè)在開展業(yè)務(wù)的過程中積累了大量的數(shù)據(jù),但由于物理和邏輯上的孤立性、合規(guī)監(jiān)管以及隱私保護(hù)等方面的原因,海量數(shù)據(jù)被獨立存儲在不同區(qū)域、企業(yè)中,彼此間互不相通,形成數(shù)據(jù)孤島,限制了數(shù)據(jù)價值的釋放。
數(shù)據(jù)隱私問題日益嚴(yán)峻,用戶信任度逐步下降
隨著各類技術(shù)的不斷發(fā)展,基于位置跟蹤、行為偏好記錄、智能推薦的各種定向精準(zhǔn)化服務(wù)在給我們提供諸多便利的同時,也產(chǎn)生了越來越多的數(shù)據(jù)隱私問題。2018年,Google被爆出50萬Google+賬戶資料外泄,先后為此付出總計高達(dá)90億美元的罰款。頻發(fā)的數(shù)據(jù)泄露問題削弱了對科技公司隱私保護(hù)能力的信任。

隱私計算助力數(shù)據(jù)融合,釋放數(shù)據(jù)價值
隨著競爭形勢的日益嚴(yán)峻,為了提高自身競爭力,越來越多的企業(yè)希望能夠與產(chǎn)業(yè)上下游公司、政府等數(shù)據(jù)主體進(jìn)行數(shù)據(jù)共享,實現(xiàn)深入合作。針對“數(shù)據(jù)孤島”問題,一種叫做“數(shù)據(jù)可用不可見“的合作新模式被提了出來。借助以聯(lián)邦學(xué)習(xí)、多方安全計算等為代表的隱私計算技術(shù),數(shù)據(jù)合作主體可以實現(xiàn)原始數(shù)據(jù)不出庫,僅數(shù)據(jù)“價值”和“知識”出庫,從而完成數(shù)據(jù)融合的目標(biāo)。
例如疫情期間,通過聯(lián)邦學(xué)習(xí)平臺可以進(jìn)行協(xié)作建模,在原始數(shù)據(jù)“足不出庫”的前提下,完成了對小微企業(yè)的精準(zhǔn)畫像,實現(xiàn)了企業(yè)信用評估、銀行授信以及政府貼息全閉環(huán)流程。
隱私計算技術(shù)實現(xiàn)“數(shù)據(jù)可用不可見”
在大數(shù)據(jù)、人工智能、“互聯(lián)網(wǎng)+”背景下,“個人信息保護(hù)”重要性進(jìn)一步提升。隱私計算技術(shù)幫助數(shù)據(jù)合作方不需要得到真實的數(shù)據(jù)就可以實現(xiàn)想要的作用,從而實現(xiàn)了不共享數(shù)據(jù),卻又共享數(shù)據(jù)的目的。
數(shù)字經(jīng)濟(jì)時代來臨,數(shù)據(jù)要素市場化配置逐漸上升為國家政策。通過政策的支持和技術(shù)的完善,隱私計算最終能夠完美實現(xiàn)數(shù)據(jù)的“可用不可見”,達(dá)到數(shù)據(jù)安全的保護(hù)目的。
利刃出鞘:隱私計算
隱私計算技術(shù)為實現(xiàn)“數(shù)據(jù)可用不可見”提供了解決方案。具體什么是隱私計算?隱私計算是在實現(xiàn)保護(hù)數(shù)據(jù)擁有者的權(quán)益安全及個人隱私的前提下,實現(xiàn)數(shù)據(jù)的流通及深度挖掘數(shù)據(jù)價值的一種重要方法。
隱私計算通常一種由兩個或多個參與方聯(lián)合計算的技術(shù)和系統(tǒng),參與方在不泄露各自數(shù)據(jù)的前提下,通過協(xié)作對他們的數(shù)據(jù)進(jìn)行聯(lián)合機器學(xué)習(xí)和聯(lián)合分析。參與方既可以是同一機構(gòu)的不同部門,也可以是不同的機構(gòu)。
隱私計算技術(shù)主要包括基于密碼學(xué)的多方安全計算、基于可信硬件的可信執(zhí)行環(huán)境以及新興的聯(lián)邦學(xué)習(xí)技術(shù)。
√ 多方安全計算主要適用于統(tǒng)計分析、判斷決策、查詢
√ 可信計算需要硬件廠商授權(quán),適用于數(shù)據(jù)保護(hù)要求較低的應(yīng)用場景
√ 聯(lián)邦學(xué)習(xí)則適用于機器學(xué)習(xí)、數(shù)據(jù)建模和數(shù)據(jù)預(yù)測分析
其中聯(lián)邦學(xué)習(xí)作為后起之秀,在數(shù)據(jù)安全中得到了廣泛的探索與發(fā)展。聯(lián)邦學(xué)習(xí)的本質(zhì)上是一種分布式的機器學(xué)習(xí)技術(shù),各個參與者不需要把數(shù)據(jù)整體移動到一個可信計算環(huán)境中,而是在本地使用本地的數(shù)據(jù)訓(xùn)練一個本地的模型,并通過場景使用半同態(tài)加密、秘密分享等隱私計算技術(shù)的方式來同步模型參數(shù),從而進(jìn)行模型的迭代訓(xùn)練。從而做到數(shù)據(jù)可用不可見,數(shù)據(jù)不動模型動,實現(xiàn)極高的安全性,合規(guī)性。
他山之石:應(yīng)用場景
各領(lǐng)域均存在數(shù)據(jù)合規(guī)流通的需求,隱私計算用武之地眾多。盡管隱私計算行業(yè)尚處早期,但已在人工智能、金融、醫(yī)療等許多場景中實現(xiàn)應(yīng)用落地。
金融領(lǐng)域:構(gòu)建反欺詐模型,打通信用信息流通
金融交易線上業(yè)務(wù)占比不斷擴大,金融聯(lián)合反欺詐勢在必行。單一來源數(shù)據(jù)構(gòu)建的反欺詐模型效果較差,因此各金融機構(gòu)具有很強的反欺詐合作意愿。但在具體合作過程中又往往擔(dān)心用戶的隱私數(shù)據(jù)和機構(gòu)的商業(yè)機密遭到泄露,造成重大不利影響。金融數(shù)據(jù)涉及商業(yè)機密,“供應(yīng)鏈金融”信用信息流通受阻,金融反欺詐也難以得到有效解決。
解決思路:各機構(gòu)可基于隱私計算技術(shù),利用多維度數(shù)據(jù)建立聯(lián)合金融反欺詐模型,共享黑名單。數(shù)據(jù)可以沒有離開各自本地的情況下,融合多方特征使得反欺詐模型達(dá)到最佳效果。“區(qū)塊鏈+隱私計算”的解決方案能夠?qū)⑵髽I(yè)的信息形成不可篡改的數(shù)據(jù)記錄,并實現(xiàn)實時信息共享。其他參與者無法獲知具體經(jīng)營信息,但可以利用其進(jìn)行信用評估計算。

醫(yī)療領(lǐng)域:提升數(shù)據(jù)挖掘效率,實現(xiàn)資源多方共享
醫(yī)院的醫(yī)療數(shù)據(jù)涉及患者隱私,數(shù)據(jù)壁壘難以打破。一方面,我國醫(yī)院體系內(nèi)部醫(yī)療數(shù)據(jù)缺乏結(jié)構(gòu)化規(guī)劃;另一方面,醫(yī)院體系外部機構(gòu)從醫(yī)院獲取數(shù)據(jù)的成本越來越高,造成大量醫(yī)療數(shù)據(jù)資源浪費,嚴(yán)重阻礙了科研開展及醫(yī)療行業(yè)的發(fā)展。如何在防止“信息泄露”的基礎(chǔ)上,實現(xiàn)多方醫(yī)療數(shù)據(jù)共享,提高醫(yī)療數(shù)據(jù)挖掘效率,是當(dāng)前醫(yī)療領(lǐng)域面臨的巨大挑戰(zhàn)。
解決思路:在利用數(shù)據(jù)脫敏等技術(shù)保證各醫(yī)療機構(gòu)數(shù)據(jù)不被泄露的基礎(chǔ)上,由政府牽頭,構(gòu)建安全數(shù)據(jù)開發(fā)平臺,獲得授權(quán)的使用者可在數(shù)據(jù)平臺上通過第三方應(yīng)用或者自己開發(fā)的程序?qū)υ紨?shù)據(jù)進(jìn)行挖掘,最后由平臺輸出數(shù)據(jù)的使用價值和結(jié)果,大幅度的提升醫(yī)療數(shù)據(jù)的利用價值,促進(jìn)科研開展和醫(yī)療行業(yè)發(fā)展。
可以攻玉:美林能力
美林?jǐn)?shù)據(jù)多年在能源行業(yè)有著豐富的數(shù)據(jù)治理及挖掘經(jīng)驗,結(jié)合強大的云邊能力,在隱私計算技術(shù)上深耕挖掘,通過云邊協(xié)同等新型技術(shù)賦能,研究隱私計算技術(shù)解決多領(lǐng)域數(shù)據(jù)安全問題。
能源領(lǐng)域:構(gòu)建能源反竊模型,保障數(shù)據(jù)共享安全
能源行業(yè)作為關(guān)乎國計民生的基礎(chǔ)行業(yè),具有巨大的數(shù)據(jù)挖掘價值,但也由于其具備天然的敏感性,此類數(shù)據(jù)直接匯聚到統(tǒng)一的平臺非常困難。水、電、氣、熱等能源數(shù)據(jù)天然形成了數(shù)據(jù)孤島,數(shù)據(jù)無法貫通嚴(yán)重阻礙了能源AI應(yīng)用落地。如何打破數(shù)據(jù)壁壘,解決“最后一公里”問題?
解決思路:以聯(lián)邦學(xué)習(xí)、安全多方計算等數(shù)據(jù)安全與隱私保護(hù)技術(shù)為核心的分布式計算平臺,產(chǎn)品針對機器學(xué)習(xí)算法進(jìn)行定制化的隱私保護(hù)改造,保證數(shù)據(jù)不出本地即可完成模型訓(xùn)練,最大化各個合作企業(yè)在數(shù)據(jù)安全的基礎(chǔ)上的數(shù)據(jù)價值,很好地解決了業(yè)界數(shù)據(jù)孤島的難題。

稅務(wù)領(lǐng)域:推動涉稅數(shù)據(jù)與電力數(shù)據(jù)共享合作
稅收數(shù)據(jù)和電力數(shù)據(jù)在宏觀上能有效反映經(jīng)濟(jì)運行現(xiàn)狀及變動趨勢,在微觀上能夠反映社會主體經(jīng)營狀況,在服務(wù)經(jīng)濟(jì)分析、精準(zhǔn)施政等方面,具備覆蓋面廣、數(shù)據(jù)質(zhì)量好、采集頻率高、顆粒度細(xì)等特點。然而,稅務(wù)與電力數(shù)據(jù)因數(shù)據(jù)隱私泄露的問題,對部分資源在涉電及涉稅數(shù)據(jù)的相關(guān)分析中出現(xiàn)阻礙。
解決思路:借助隱私計算,共享并融合稅務(wù)與電力數(shù)據(jù),提升稅務(wù)與電力數(shù)據(jù)的含金量,實現(xiàn)隱私保護(hù)下的高質(zhì)量數(shù)據(jù)協(xié)作。同時通過隱私計算平臺,促進(jìn)稅務(wù)和電力的數(shù)據(jù)協(xié)作,實現(xiàn)政企數(shù)據(jù)融合應(yīng)用。
引玉之磚:未來發(fā)展
隱私計算技術(shù)日益完善,未來有望邁入快車道
2020年10月20日,隱私計算入選Gartner2021年九大重要科技趨勢。根據(jù)Gartner預(yù)測,2025年將有一半的大型企業(yè)機構(gòu)在不受信任的環(huán)境和多方數(shù)據(jù)分析用例中使用隱私增強計算處理數(shù)據(jù),隱私計算技術(shù)將在2-5年內(nèi)走向成熟。
大鵬一日同風(fēng)起,扶搖直上九萬里。美林?jǐn)?shù)據(jù)多年來深耕行業(yè)應(yīng)用,不斷沉淀總結(jié)技術(shù)與業(yè)務(wù)的最佳結(jié)合點,在大數(shù)據(jù)與人工智能時代積累了豐富的行業(yè)級算法庫及強大的算法能力。通過云邊等新型技術(shù)賦能,積極發(fā)展隱私計算能力,美林?jǐn)?shù)據(jù)正昂首挺胸,踐行以客戶為中心,為用戶提供安全可靠的大數(shù)據(jù)技術(shù)服務(wù),為傳統(tǒng)企業(yè)數(shù)字化轉(zhuǎn)型提供美林力量!