摘要:如何識(shí)別數(shù)據(jù)海洋中的暗礁是用戶行為異常行為分析所要探討的問題。在時(shí)間序列數(shù)據(jù)中檢測(cè)到與預(yù)期行為有偏差的數(shù)據(jù)對(duì)于確保系統(tǒng)的正常運(yùn)行非常重要。局部異常發(fā)生在這種情況下。例如晚上的高活動(dòng)意味著異常。
“今天我們見證了數(shù)據(jù)的爆炸式增長(zhǎng):社交媒體數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、CRM數(shù)據(jù)以及大量網(wǎng)絡(luò)數(shù)據(jù)。然而, 在大多數(shù)情況下,這些數(shù)據(jù)告訴了我們用戶行為的常見模式。 數(shù)據(jù)的異常變化可能是我們系統(tǒng)中的故障或用戶流失的“癥結(jié)”所在。
如何識(shí)別數(shù)據(jù)海洋中的“暗礁”是用戶行為異常行為分析所要探討的問題。
▼
▍什么是異常檢測(cè)?
異常檢測(cè)是在數(shù)據(jù)中找到不符合“正?!钡男袨槟J降倪^程。在時(shí)間序列數(shù)據(jù)中檢測(cè)到與預(yù)期行為有偏差的數(shù)據(jù)對(duì)于確保系統(tǒng)的正常運(yùn)行非常重要。
一般來說,異常可以分成兩種:
▍全局異常/局部異常
局部異常
很多時(shí)候我們可以看到數(shù)據(jù)的潛在趨勢(shì),看起來像一個(gè)“波浪”:早上的活動(dòng)不足,白天很高,晚上很低。 局部異常發(fā)生在這種情況下。 例如:晚上的高活動(dòng)意味著異常。
全局異常
這是我們最熟悉的那種異?,F(xiàn)象。 這是一個(gè)隨機(jī)出現(xiàn)在平常時(shí)間的異常現(xiàn)象。 一般使用95%分位數(shù)就可以檢測(cè)到。
▍異常檢測(cè)方法
我們使用歷史數(shù)據(jù)來構(gòu)建由每個(gè)被監(jiān)測(cè)的數(shù)據(jù)的估計(jì)值。將實(shí)時(shí)數(shù)據(jù)與這些值進(jìn)行比較,并分配一個(gè)分?jǐn)?shù)。
基于從最近的數(shù)據(jù)觀察得到的閾值,決定實(shí)時(shí)數(shù)據(jù)是否為異常。這種方法的優(yōu)點(diǎn)是閾值不是靜態(tài)的,而是實(shí)時(shí)的。
檢測(cè)場(chǎng)景:
tecdat的解決方案從收集網(wǎng)站的行為數(shù)據(jù)開始。衡量趨勢(shì)的三個(gè)主要組成部分,即固定趨勢(shì)、周期趨勢(shì)和季節(jié)性數(shù)據(jù),分別進(jìn)行了總結(jié),該算法查找到數(shù)據(jù)中的異常,向用戶發(fā)送自動(dòng)實(shí)時(shí)警報(bào)。
通過實(shí)時(shí)的異常數(shù)據(jù)監(jiān)測(cè),我們可以清楚地看到網(wǎng)站流量的差異,在發(fā)生異常狀況時(shí)迅速進(jìn)行故障排除和修復(fù),減少網(wǎng)站停機(jī),減少潛在客戶的流失。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/40808.html
摘要:如何識(shí)別數(shù)據(jù)海洋中的暗礁是用戶行為異常行為分析所要探討的問題。在時(shí)間序列數(shù)據(jù)中檢測(cè)到與預(yù)期行為有偏差的數(shù)據(jù)對(duì)于確保系統(tǒng)的正常運(yùn)行非常重要。局部異常發(fā)生在這種情況下。例如晚上的高活動(dòng)意味著異常。 showImg(https://segmentfault.com/img/bVUlDV?w=993&h=526);今天我們見證了數(shù)據(jù)的爆炸式增長(zhǎng):社交媒體數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、CRM數(shù)據(jù)以及大量網(wǎng)絡(luò)數(shù)...
摘要:如何識(shí)別數(shù)據(jù)海洋中的暗礁是用戶行為異常行為分析所要探討的問題。在時(shí)間序列數(shù)據(jù)中檢測(cè)到與預(yù)期行為有偏差的數(shù)據(jù)對(duì)于確保系統(tǒng)的正常運(yùn)行非常重要。局部異常發(fā)生在這種情況下。例如晚上的高活動(dòng)意味著異常。 showImg(https://segmentfault.com/img/bVUlDV?w=993&h=526);今天我們見證了數(shù)據(jù)的爆炸式增長(zhǎng):社交媒體數(shù)據(jù)、系統(tǒng)數(shù)據(jù)、CRM數(shù)據(jù)以及大量網(wǎng)絡(luò)數(shù)...
摘要:基于以上背景,研究人員對(duì)年至今的電信用戶流失數(shù)據(jù)進(jìn)行分析,并建立預(yù)測(cè)模型,識(shí)別出流失概率很高的客戶群體,同時(shí)找出哪些用戶特征對(duì)用戶流失會(huì)有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費(fèi)者今天會(huì)訂閱多個(gè)電信服務(wù)(電視、付費(fèi)節(jié)目、游戲等)。然而電信供應(yīng)商提供的服務(wù)的差異化程度不高,客戶忠誠度成為...
摘要:基于以上背景,研究人員對(duì)年至今的電信用戶流失數(shù)據(jù)進(jìn)行分析,并建立預(yù)測(cè)模型,識(shí)別出流失概率很高的客戶群體,同時(shí)找出哪些用戶特征對(duì)用戶流失會(huì)有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費(fèi)者今天會(huì)訂閱多個(gè)電信服務(wù)(電視、付費(fèi)節(jié)目、游戲等)。然而電信供應(yīng)商提供的服務(wù)的差異化程度不高,客戶忠誠度成為...
閱讀 1049·2021-11-22 13:53
閱讀 1599·2021-11-17 09:33
閱讀 2401·2021-10-14 09:43
閱讀 2863·2021-09-01 11:41
閱讀 2280·2021-09-01 10:44
閱讀 2920·2021-08-31 09:39
閱讀 1457·2019-08-30 15:44
閱讀 1866·2019-08-30 13:02