摘要:事故預(yù)測(cè)需要獲取有意義和可靠的信息,大量原始信息流必須在危機(jī)期間進(jìn)行分析和處理。時(shí)間維度事故分析通過(guò)時(shí)間維度日期和時(shí)間的事故分析,我們可以洞察到不同類型的事故發(fā)生的高峰時(shí)間和高發(fā)月份,從而進(jìn)行有效預(yù)防。結(jié)果模型預(yù)測(cè)精度精度達(dá)到。
“
原文鏈接
針對(duì)當(dāng)前生產(chǎn)和生活中面臨的安全事故問(wèn)題,利用當(dāng)前發(fā)展迅速的DM(Data Mining)技術(shù),通過(guò)對(duì)事故信息的多維度分析,實(shí)現(xiàn)監(jiān)測(cè)系統(tǒng)的事故預(yù)測(cè),提高了監(jiān)測(cè)系統(tǒng)的性能,形成安全預(yù)警機(jī)制。
▼
事故預(yù)測(cè)需要獲取有意義和可靠的信息,大量原始信息流必須在危機(jī)期間進(jìn)行分析和處理。
基于以上背景,tecdat研究人員重點(diǎn)關(guān)注事故情報(bào)數(shù)據(jù)的收集并分析相關(guān)信息,通過(guò)對(duì)時(shí)間、地點(diǎn)、語(yǔ)義等不同維度的分析得到有價(jià)值的信息,并且嘗試通過(guò)機(jī)器學(xué)習(xí)方法對(duì)事故發(fā)生進(jìn)行預(yù)測(cè)。
▍時(shí)間維度事故分析
通過(guò)時(shí)間維度(日期和時(shí)間)的事故分析,我們可以洞察到不同類型的事故發(fā)生的高峰時(shí)間和高發(fā)月份,從而進(jìn)行有效預(yù)防。
通過(guò)對(duì)結(jié)果的可視化,可以發(fā)現(xiàn)不同時(shí)間和月份的事故發(fā)生率有一定的差異,因此在后續(xù)的預(yù)測(cè)模型中可以構(gòu)建相應(yīng)的時(shí)間偽變量從而提高精度。
▍不同事故類型
通過(guò)對(duì)所有事故數(shù)據(jù)類型的占比分析,我們可以發(fā)現(xiàn)出行的事故發(fā)生率是最高的,也遠(yuǎn)遠(yuǎn)高于其他類型,其次是觸電事故等。(注:部分事故重屬多個(gè)類型)
▍事故報(bào)告語(yǔ)義分析
通過(guò)對(duì)事故報(bào)告的語(yǔ)義分析,我們可以發(fā)現(xiàn)報(bào)告中頻繁出現(xiàn)的關(guān)鍵詞,從中洞察到某類事故發(fā)生后通常會(huì)關(guān)聯(lián)到哪些關(guān)鍵詞,分析其背后的原因,從而進(jìn)行有效的預(yù)防。
▍安全事故預(yù)測(cè)模型
在獲得事故的不同維度基本特征之后,我們通過(guò)SVM算法使用這些特征來(lái)預(yù)測(cè)不同類型的事故發(fā)生的可能性,采取有針對(duì)性的措施,避免未知事故發(fā)生帶來(lái)的損失,達(dá)到補(bǔ)救的效果。
▍技術(shù)
SVM(Support Vector Machine)用于構(gòu)建、驗(yàn)證和測(cè)試數(shù)據(jù)集的模型。
在Spark / MLLib / Scikit-Learn / HDFS中重構(gòu)實(shí)現(xiàn)處理較大的數(shù)據(jù)集。
▍結(jié)果
模型預(yù)測(cè)精度精度達(dá)到82.5%。
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/25878.html
摘要:事故預(yù)測(cè)需要獲取有意義和可靠的信息,大量原始信息流必須在危機(jī)期間進(jìn)行分析和處理。時(shí)間維度事故分析通過(guò)時(shí)間維度日期和時(shí)間的事故分析,我們可以洞察到不同類型的事故發(fā)生的高峰時(shí)間和高發(fā)月份,從而進(jìn)行有效預(yù)防。結(jié)果模型預(yù)測(cè)精度精度達(dá)到。 showImg(https://segmentfault.com/img/bVVkhf?w=829&h=431); 原文鏈接 針對(duì)當(dāng)前生產(chǎn)和生活中面臨的安全...
摘要:事故預(yù)測(cè)需要獲取有意義和可靠的信息,大量原始信息流必須在危機(jī)期間進(jìn)行分析和處理。時(shí)間維度事故分析通過(guò)時(shí)間維度日期和時(shí)間的事故分析,我們可以洞察到不同類型的事故發(fā)生的高峰時(shí)間和高發(fā)月份,從而進(jìn)行有效預(yù)防。結(jié)果模型預(yù)測(cè)精度精度達(dá)到。 showImg(https://segmentfault.com/img/bVVkhf?w=829&h=431); 原文鏈接 針對(duì)當(dāng)前生產(chǎn)和生活中面臨的安全...
摘要:基于以上背景,研究人員對(duì)年至今的電信用戶流失數(shù)據(jù)進(jìn)行分析,并建立預(yù)測(cè)模型,識(shí)別出流失概率很高的客戶群體,同時(shí)找出哪些用戶特征對(duì)用戶流失會(huì)有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費(fèi)者今天會(huì)訂閱多個(gè)電信服務(wù)(電視、付費(fèi)節(jié)目、游戲等)。然而電信供應(yīng)商提供的服務(wù)的差異化程度不高,客戶忠誠(chéng)度成為...
摘要:基于以上背景,研究人員對(duì)年至今的電信用戶流失數(shù)據(jù)進(jìn)行分析,并建立預(yù)測(cè)模型,識(shí)別出流失概率很高的客戶群體,同時(shí)找出哪些用戶特征對(duì)用戶流失會(huì)有重大影響。 showImg(https://segmentfault.com/img/bVUMPC?w=747&h=384); 原文鏈接 消費(fèi)者今天會(huì)訂閱多個(gè)電信服務(wù)(電視、付費(fèi)節(jié)目、游戲等)。然而電信供應(yīng)商提供的服務(wù)的差異化程度不高,客戶忠誠(chéng)度成為...
閱讀 739·2021-11-24 10:19
閱讀 1126·2021-09-13 10:23
閱讀 3444·2021-09-06 15:15
閱讀 1788·2019-08-30 14:09
閱讀 1701·2019-08-30 11:15
閱讀 1850·2019-08-29 18:44
閱讀 947·2019-08-29 16:34
閱讀 2470·2019-08-29 12:46