摘要:賽題鏈接面向電信行業(yè)存量用戶的智能套餐個性化匹配模型賽題任務(wù)利用已有的用戶屬性如個人基本信息用戶畫像信息等終端屬性如終端品牌等業(yè)務(wù)屬性消費(fèi)習(xí)慣及偏好匹配用戶最合適的套餐,對用戶進(jìn)行推送,完成后續(xù)個性化服務(wù)。四個月的費(fèi)用分別進(jìn)行。
1、賽題鏈接:面向電信行業(yè)存量用戶的智能套餐個性化匹配模型
2、賽題任務(wù): 利用已有的用戶屬性(如個人基本信息、用戶畫像信息等)、終端屬性(如終端品牌等)、業(yè)務(wù)屬性、消費(fèi)習(xí)慣及偏好匹配用戶最合適的套餐,對用戶進(jìn)行推送,完成后續(xù)個性化服務(wù)。
3、數(shù)據(jù)解讀及預(yù)處理:
多分類任務(wù)-->11分類;根據(jù)service_type來劃分套餐 ,一類8個,另外一類3個(下文圖片里面的大寶卡以及騰訊王卡系列)。
11個套餐表所對應(yīng)的卡,通過對1_total_fee進(jìn)行value_counts和網(wǎng)上套餐比較可以大致推出來。
數(shù)據(jù)預(yù)處理---->清洗數(shù)據(jù)以及對1234_total_fee進(jìn)行類似3sigma的進(jìn)行標(biāo)記。
4、特征工程:
對1-2-3-4_total_fee進(jìn)行min ,max ,std ,mean等操作;最后發(fā)現(xiàn)四個月話費(fèi)的最小值是比較強(qiáng)的特征,從EDA來看對套餐區(qū)分是比較明顯的。
本月流量以及上個月流量的差值特征;并且發(fā)現(xiàn)某些用戶上個月的流量是一個完整的數(shù)值,比方說1024,2048,3072這種數(shù)值,對這種用戶進(jìn)行了簡單的標(biāo)記。
用當(dāng)月費(fèi)用減去超出通話時長的錢。1_total_fee - (service1_caller_time)*0.15
計(jì)算每個用戶的基本費(fèi)用(base_fee)
判斷四個月的話費(fèi)是否是一個整數(shù)。比方說套餐36的用戶如果賬單里面出現(xiàn)了36和36.0的話,那么后者36.0可能是其他base_fee通過開加油包等超出套餐費(fèi)用疊加上來的。
四個月的費(fèi)用分別groupby("complaint_fee")進(jìn)行count。
5、搭建模型:
模型: 十折的lightgbm模型 + 五折的xgboost模型
xgboost實(shí)在是太慢了,沒有GPU加成的話貌似要跑差不多一個白天,但是用上GPU精度就降低了。
6、模型融合: 通過林有夕大神分享的投票代碼進(jìn)行融合,有一點(diǎn)收益但是不大。
7、處理:
我們隊(duì)伍是失敗了,大概思路就是對模型分不開的兩個套餐加一個權(quán)重。決賽隊(duì)伍應(yīng)該都是有分享的。
還有就是植物之前ijcai2018所用過的"食之無味,棄之可惜",惜的是我們也失敗了。
最后附上我們隊(duì)的github鏈接(記得點(diǎn)個星星哦~)
開源代碼地址:2018_CCF_BDCI_ChinaUnicom_Package_Match_Rank6
這個比賽第一名,第二名,第四名貌似都有開源,還有砍手豪大佬對植物嫁接的進(jìn)一步深入在知乎上都有文章,可以進(jìn)行參考。
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/43538.html
摘要:目前資訊播報時區(qū)限行歷史上的今天單位換算油價日歷等技能天貓精靈上線技能觸發(fā)率,準(zhǔn)確率即對話管理,是對話系統(tǒng)的關(guān)鍵部分,負(fù)責(zé)維護(hù)對話上下文,管理對話流程,保持對話過程的流暢。 術(shù)語對齊 TaskBot引擎: 核心處理對象是技能,我們把技能定義成結(jié)構(gòu)化(query+content)、垂直場景化的任務(wù),比如實(shí)時場景查詢、工具類、控制類等QABot引擎: 包括KG-QA引擎、QAPair引擎、...
摘要:目前資訊播報時區(qū)限行歷史上的今天單位換算油價日歷等技能天貓精靈上線技能觸發(fā)率,準(zhǔn)確率即對話管理,是對話系統(tǒng)的關(guān)鍵部分,負(fù)責(zé)維護(hù)對話上下文,管理對話流程,保持對話過程的流暢。 術(shù)語對齊 TaskBot引擎: 核心處理對象是技能,我們把技能定義成結(jié)構(gòu)化(query+content)、垂直場景化的任務(wù),比如實(shí)時場景查詢、工具類、控制類等QABot引擎: 包括KG-QA引擎、QAPair引擎、...
摘要:中金易云出版發(fā)行大數(shù)據(jù)平臺正是以數(shù)字化轉(zhuǎn)型為核心思路,以大數(shù)據(jù)中臺與智能算法為基礎(chǔ)的出版業(yè)供給側(cè)結(jié)構(gòu)性改革的成果。 摘要: 以供給側(cè)結(jié)構(gòu)性改革的角度來看,出版社即是最直接的供給側(cè),出版高質(zhì)量、暢銷度高的圖書,建立出產(chǎn)高質(zhì)量圖書及圖書IP的體系,即是提高供給體系質(zhì)量。中金易云出版發(fā)行大數(shù)據(jù)平臺正是以數(shù)字化轉(zhuǎn)型為核心思路,以大數(shù)據(jù)中臺與智能算法為基礎(chǔ)的出版業(yè)供給側(cè)結(jié)構(gòu)性改革的成果。 201...
摘要:對于這類企業(yè)來說,邊緣計(jì)算是從云計(jì)算中心層層向外推出去的,成長路徑是自頂向下,由內(nèi)而外。這是云計(jì)算公司力推邊緣計(jì)算的商業(yè)邏輯。相對于其他玩家,電信運(yùn)營商擁有的資源優(yōu)勢和基礎(chǔ)布局,在邊緣計(jì)算的競爭中贏在了起跑線上。前一篇文章(漫談邊緣計(jì)算(一):邊緣計(jì)算是大勢所趨)提到我對邊緣計(jì)算的理解,認(rèn)為邊緣計(jì)算是在一定程度上彌補(bǔ)傳統(tǒng)云計(jì)算的不足,相對于傳統(tǒng)的全集中模式的云計(jì)算中心,邊緣計(jì)算節(jié)點(diǎn)可以在現(xiàn)場...
閱讀 2091·2021-11-23 10:13
閱讀 2799·2021-11-09 09:47
閱讀 2743·2021-09-22 15:08
閱讀 3323·2021-09-03 10:46
閱讀 2239·2019-08-30 15:54
閱讀 921·2019-08-28 18:09
閱讀 2433·2019-08-26 18:26
閱讀 2346·2019-08-26 13:48