服務(wù)熱線
400-608-2558
咨詢熱線
15502965860
算法類型 | 功能節(jié)點(diǎn) | 說(shuō)明 |
數(shù)據(jù)預(yù)處理 | 提供對(duì)數(shù)據(jù)進(jìn)行預(yù)處理功能,包括對(duì)數(shù)據(jù)的清洗、轉(zhuǎn)換、歸約、集成等,以便提高分析數(shù)據(jù)的質(zhì)量。 | 行:數(shù)據(jù)過(guò)濾、排序、隨機(jī)抽樣、數(shù)據(jù)平衡、數(shù)據(jù)去重; 列:設(shè)置角色、重命名、屬性過(guò)濾、隨機(jī)數(shù)/ID生成、缺失值處理、數(shù)值型屬性變換、字符型屬性變換、日期型屬性變換; 高級(jí):表轉(zhuǎn)置、 分類匯總、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)平滑、孤立點(diǎn)分析、RFM、季節(jié)解構(gòu)、異常值檢測(cè)、自動(dòng)數(shù)據(jù)處理、堆疊列、過(guò)程查詢分析器; 融合:數(shù)據(jù)連接、數(shù)據(jù)追加、數(shù)據(jù)拆分、數(shù)據(jù)分解、數(shù)據(jù)差集; 特征工程:屬性生成、主成分分析、因子分析、奇異值分解、分箱、變量選擇、自動(dòng)特征、WOE編碼、數(shù)據(jù)分組、特征編碼、高級(jí)特征交叉。 |
分類 | 分類屬于預(yù)測(cè)任務(wù),就是通過(guò)已有數(shù)據(jù)集(訓(xùn)練集)的學(xué)習(xí),得到一個(gè)目標(biāo)函數(shù)f(模型),把每個(gè)屬性集x映射到目標(biāo)屬性y(類),且y必須是離散的。 | 邏輯回歸分類、樸素貝葉斯、Xgboost分類、貝葉斯網(wǎng)絡(luò)分類、BP神經(jīng)網(wǎng)絡(luò)分類、隨機(jī)森林分類、支持向量機(jī)分類、 CART、ID3分類、C45+決策樹(shù)分類、梯度提升決策樹(shù)分類、L1/2稀疏迭代分類、RBF神經(jīng)網(wǎng)絡(luò)分類、KNN、線性判別分類、Adaboost分類、Bagging分類、DNN分類。 |
回歸 | 回歸是最常用的數(shù)值預(yù)測(cè)方法,它是在分析現(xiàn)象自變量和因變量之間相關(guān)關(guān)系的基礎(chǔ)上,建立變量之間的回歸方程,并將回歸方程作為預(yù)測(cè)模型,根據(jù)自變量在預(yù)測(cè)期的數(shù)量變化來(lái)預(yù)測(cè)因變量的值。 | 線性回歸、決策樹(shù)回歸、SVM回歸、梯度提升樹(shù)回歸、BP神經(jīng)網(wǎng)絡(luò)回歸、保序回歸、曲線回歸、隨機(jī)森林回歸、L1/2稀疏迭代回歸、Bagging回歸、DNN回歸、LSTM回歸。 |
聚類 | 聚類分析僅根據(jù)在數(shù)據(jù)中發(fā)現(xiàn)的描述對(duì)象及其關(guān)系的信息,將數(shù)據(jù)對(duì)象分組。其目標(biāo)是,組內(nèi)的對(duì)象相互之間是相似的(相關(guān)的),而不同組中的對(duì)象是不同的(不相關(guān)的)。 | KMeans、模糊C均值、EM聚類、Hierarchy、Kohonen聚類、視覺(jué)聚類、Canopy、冪迭代。 |
關(guān)聯(lián)規(guī)則 | 關(guān)聯(lián)規(guī)則,指在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)構(gòu)。 | Apriori、FPGrowth、序列。 |
時(shí)間序列 | 時(shí)間序列通常是按時(shí)間順序排列的一系列被觀測(cè)數(shù)據(jù)(信息),其觀測(cè)值按固定的時(shí)間間隔采樣。研究人員作預(yù)測(cè)時(shí),常以過(guò)去的歷史資料為依據(jù),預(yù)測(cè)將來(lái)的變化。 | ARIMA、稀疏時(shí)間序列、指數(shù)平滑、移動(dòng)平均、向量自回歸、X11、X12、回聲狀態(tài)網(wǎng)絡(luò)、灰色預(yù)測(cè)。 |
綜合評(píng)價(jià) | 使用比較系統(tǒng)的、規(guī)范的方法對(duì)于多個(gè)指標(biāo)、多個(gè)單位同時(shí)進(jìn)行評(píng)價(jià)的方法,稱為綜合評(píng)價(jià)方法 | 熵值法、TOPSIS、層次分析法、模糊綜合評(píng)價(jià)法。 |
推薦 | 推薦是根據(jù)用戶興趣和行為特點(diǎn),向用戶推薦所需的信息或商品,幫助用戶在海量信息中快速發(fā)現(xiàn)真正所需的商品。 | 協(xié)同過(guò)濾。 |
文本挖掘 | 文本挖掘是指從大量文本數(shù)據(jù)中抽取事先未知的、可理解的、最終可用的知識(shí)的過(guò)程,同時(shí)運(yùn)用這些知識(shí)更好地組織信息以便將來(lái)參考。 | 分詞、信息抽取、文本過(guò)濾、向量空間、關(guān)鍵詞提取、主旨話題分析、觀點(diǎn)情感分析、垃圾違禁信息檢測(cè)、文本相似度、命名實(shí)體識(shí)別、文本摘要、詞頻統(tǒng)計(jì)、主題模型合并。 |
統(tǒng)計(jì)分析 | 提供統(tǒng)計(jì)分析方法,對(duì)通過(guò)調(diào)查獲取的各種數(shù)據(jù)及資料進(jìn)行數(shù)理統(tǒng)計(jì)和分析,形成定性和定量的結(jié)論。 | 方差分析、相關(guān)系數(shù)、典型相關(guān)分析、偏向相關(guān)分析、相似度、描述數(shù)據(jù)特征、概率單位回歸。 |