成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

第四范式:用最小可用產(chǎn)品(MVP)快速驗證AI價值

haitiancoder / 2057人閱讀

摘要:近日,峰會在京盛大開幕。所以對于游戲而言,可將最小可用產(chǎn)品的優(yōu)化目標定位在盡快鎖定游戲的高價值用戶,且鎖定時間要迅速。第四范式在這方面已經(jīng)做了一些工作,先知平臺已經(jīng)根據(jù)連續(xù)和離散的數(shù)據(jù)的計算特性做針對性的設(shè)計。

近日,AWS 2017峰會在京盛大開幕。第四范式互聯(lián)網(wǎng)業(yè)務(wù)負責人周開拓受邀出席,并發(fā)表了“打造人工智能MVP”的主題演講,分享了企業(yè)高效、快速地向人工智能轉(zhuǎn)型的寶貴經(jīng)驗。周開拓曾任職于淘寶網(wǎng),負責在線推薦系統(tǒng)的設(shè)計和算法工作,加入第四范式之后,基于第四范式核心產(chǎn)品“先知”,孵化了面向中小企業(yè)的公有云版機器學習服務(wù),致力于完成內(nèi)容推薦、電商推薦、精準營銷、計算廣告等關(guān)鍵業(yè)務(wù)的AI轉(zhuǎn)型。

快速定位機器學習的MVP

在移動互聯(lián)網(wǎng)領(lǐng)域,最容易被接受的一個概念便是最小可用產(chǎn)品(MVP),即開發(fā)團隊、設(shè)計團隊用最小的成本、冒最小的風險,最大程度去驗證產(chǎn)品的可行性——這個產(chǎn)品的可行性,是指這個需求是否真實存在,當前產(chǎn)品解決這個需求的方向是否是正確的。機器學習亦是如此,企業(yè)對于機器學習的投入是長期、持續(xù)的,帶來的收入和回報也是巨大的,但在此之前,企業(yè)更希望用較低的成本去驗證:引入機器學習是否可以帶來業(yè)務(wù)指標的提升,產(chǎn)生價值的潛力有多大。

以較為經(jīng)典的推薦系統(tǒng)為例,數(shù)據(jù)科學家往往會從點擊、購買、收藏、轉(zhuǎn)發(fā)分享等來表達用戶是否喜歡推薦的商品。為了簡化目標,可以選擇點擊作為最小可用產(chǎn)品的優(yōu)化方向,因為點擊是所有事情發(fā)生的前提,且點擊率容易得到較好的優(yōu)化效果。而在游戲運營方面,其目標主要是盡可能延長玩家停留的時間,并且吸引玩家付費,故提高用戶留存率便是重中之重。但由于留存率更多地由游戲本身的可玩性和玩家的興趣喜好決定,可干預(yù)性不高,所以留存率較難影響。盡管整體的留存率難干預(yù),但游戲收入都是由極少數(shù)忠實玩家提供,這部分玩家可以用很強的運營策略進行干預(yù)。所以對于游戲而言,可將最小可用產(chǎn)品的優(yōu)化目標定位在盡快鎖定游戲的高價值用戶,且鎖定時間要迅速。

機器學習MVP的關(guān)鍵步驟

在機器學習的項目中,數(shù)據(jù)決定效果的上限;建模、調(diào)參則是達到上限的過程。因此數(shù)據(jù)處理、建模、調(diào)參,是成功實現(xiàn)一個機器學習MVP至關(guān)重要的步驟。

以往,公司規(guī)模越大的企業(yè)獲取數(shù)據(jù)越麻煩,且在數(shù)據(jù)的使用時,若使用了錯誤的方式進行拼接,項目后期出現(xiàn)問題時,很難debug。所以在項目前期,需要控制項目風險和成本的前提下,盡量使用熟悉、好理解的數(shù)據(jù)。寧可犧牲一些效果,也要避免使用看似有吸引力,但風險更大的數(shù)據(jù)。

對于數(shù)據(jù)本身來說,數(shù)據(jù)的挑選、數(shù)據(jù)是否有預(yù)測性等,無需耗費過多的人力去考慮,針對此類工作目前已經(jīng)有了很成熟的方法和工具,在不違背因果關(guān)系的前提下,我們盡可能地讓機器去自主完成,此外,真實的數(shù)據(jù)缺失是正常的,不缺失的數(shù)據(jù)可能才是有問題的,我們已經(jīng)有很多方式來填充缺失值,或者把缺失本身也作為一個特征。其次,數(shù)據(jù)有離散的、連續(xù)的,比如預(yù)測一個游戲玩家是不是高價值用戶,那么數(shù)據(jù)可能有這個玩家已經(jīng)消費的鉆石、金幣數(shù)量,可能有這個玩家的職業(yè),甚至是玩家手機型號,這就要求數(shù)據(jù)處理中能同時處理這兩類特征。第四范式在這方面已經(jīng)做了一些工作,先知平臺已經(jīng)根據(jù)連續(xù)和離散的數(shù)據(jù)的計算特性做針對性的設(shè)計。

數(shù)據(jù)選定之后,便開始建模。其中,特征組合與調(diào)參是關(guān)鍵。在解決實際問題中,業(yè)界傾向于先使用簡單的邏輯回歸LR模型,為了模型具備更強的學習能力及表達能力,就需要使特征具備非線性的特性。特征組合便是一種常用且效果明顯的方法。換句話說,特征組合是一種加強特征描述能力,提升模型預(yù)測效果的方法。然而,想要獲得特征組合并非易事,需要數(shù)據(jù)科學家具備極強的機器學習知識儲備及業(yè)務(wù)理解能力。調(diào)參亦是如此。

事實上,特征組合與調(diào)參這類重復(fù)性較強且占用時間較多的工作可以用機器自動完成。在將數(shù)據(jù)科學家的經(jīng)驗固化為產(chǎn)品之后,技術(shù)人員只需設(shè)定好用于組合的基礎(chǔ)特征,以及參數(shù)的類別、次數(shù)即可。目前,第四范式先知平臺(試用鏈接:https://prophet.4paradigm.com...)依靠自主研發(fā)的FeatureGo算法,實現(xiàn)了機器自動特征組合、自動調(diào)參的功能,解決了以往人為添加組合特征門檻高、耗時長等問題,大大節(jié)省了建模的時間。舉個例子,此前第四范式基于先知平臺打造了某新聞內(nèi)容平臺的新聞推薦系統(tǒng),從數(shù)據(jù)基礎(chǔ)開始構(gòu)建,收集、分析、挖掘了新聞及用戶等各個維度的數(shù)據(jù),再通過自動特征工程、自動調(diào)參等功能,只耗費2周時間就訓練出了特征維度數(shù)十億級別的模型。最終,該平臺推薦新聞的點擊率提高35%,顯著提升了用戶的使用體驗。

綜上所述,當定義好了問題的目標、邊界,利用現(xiàn)有的數(shù)據(jù)、人員,再配上一個專業(yè)的工具,一個機器學習業(yè)務(wù)改造系統(tǒng)的上線可以非常快速、有效。當機器學習技術(shù)真正產(chǎn)生了效果,客戶就知道下一步應(yīng)該如何投入資源,以及應(yīng)該投在什么地方。

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19638.html

相關(guān)文章

  • 當小企業(yè)遇上大平臺:一位華為云MVP的自述

    摘要:小企業(yè)遇上了大平臺即便是在人才濟濟的眾多華為云當中,劉源仍然相當搶眼,原因之一就是他看上去實在太年輕了。而在本次華為云開放日活動上,華為云對開發(fā)者的重視更是得到了進一步的體現(xiàn)。華為云MVP的使命在華為云攜手眾多合作伙伴打造的開發(fā)者生態(tài)中,活躍著這樣一群技術(shù)大咖的身影。這群技術(shù)大咖當中,既有優(yōu)先體驗產(chǎn)品權(quán)益、反饋產(chǎn)品優(yōu)化建議的產(chǎn)品體驗官;也有在公開活動中,分享技術(shù)經(jīng)驗和實戰(zhàn)經(jīng)驗的技術(shù)布道者;還...

    A Loity 評論0 收藏0
  • 英特爾發(fā)布"概念驗證"白皮書:AI人工智能落地,如何輔助決策者將價值最大化

    摘要:那么,什么樣的機遇能夠帶來最好的結(jié)果如何確保能取得成功的結(jié)果呢英特爾為此提出了一套概念驗證的解決方案,并且詳細撰寫了一套白皮書,能夠幫助決策者回答這些問題,同時最大化價值,最小化風險。 showImg(http://upload-images.jianshu.io/upload_images/13825820-5ded473acf69a9d1.jpg?imageMogr2/auto-o...

    Leck1e 評論0 收藏0
  • 第四范式戴文淵:機器學習教科書的 7 大經(jīng)典問題

    摘要:針對這個問題,第四范式創(chuàng)始人首席執(zhí)行官戴文淵近日就在公司內(nèi)部分享上,向大家介紹了機器學習教材中的七個經(jīng)典問題。所以今天我就想和大家分享一下機器學習教材中的一些經(jīng)典問題,希望對大家今后的工作和學習有所幫助。 *如果希望了解機器學習,或者已經(jīng)決定投身機器學習,你會第一時間找到各種教材進行充電,同時在心中默認:書里講的是牛人大神的畢生智慧,是正確無誤的行動指南,認真學習就能獲得快速提升。但實...

    DevTTL 評論0 收藏0

發(fā)表評論

0條評論

最新活動
閱讀需要支付1元查看
<