成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

在一頭扎進機器學(xué)習(xí)前應(yīng)該知道的那些事兒

moven_j / 1991人閱讀

摘要:當(dāng)掌握機器學(xué)習(xí)基本知識以及清楚自己所要處理的任務(wù)后,應(yīng)用機器學(xué)習(xí)就不會那么難了。因此,在學(xué)習(xí)和應(yīng)用機器學(xué)習(xí)之前,我們首先應(yīng)該明確自己的任務(wù)是什么,以及適合使用哪種機器學(xué)習(xí)方法來完成。

摘要: 本文簡單總結(jié)了機器學(xué)習(xí)的幾大任務(wù)及其對應(yīng)的方法,方便初學(xué)者根據(jù)自己的任務(wù)選擇合適的方法。當(dāng)掌握機器學(xué)習(xí)基本知識以及清楚自己所要處理的任務(wù)后,應(yīng)用機器學(xué)習(xí)就不會那么難了。

機器學(xué)習(xí)一直是一個火熱的研究領(lǐng)域,深度學(xué)習(xí)方法的提出又為這個領(lǐng)域添了一把火,使得很多人對該領(lǐng)域感興趣并想投身于該領(lǐng)域的研究之中。那么,對于想從事機器學(xué)習(xí)領(lǐng)域的人來說,有哪些是應(yīng)該首先了解的內(nèi)容呢?本文將簡單的介紹下機器學(xué)習(xí)的基本相關(guān)知識。
機器學(xué)習(xí)是指使計算機系統(tǒng)使用統(tǒng)計技術(shù)學(xué)習(xí)數(shù)據(jù)的過程,而不需要具體的編程程序。該方法是一個主動學(xué)習(xí)的算法,使得它能夠從數(shù)據(jù)中學(xué)習(xí)并進行預(yù)測。機器學(xué)習(xí)與計算統(tǒng)計、數(shù)學(xué)優(yōu)化以及數(shù)據(jù)學(xué)習(xí)密切相關(guān),通常被用來進行預(yù)測、分析等任務(wù)。機器學(xué)習(xí)一般用于處理兩類任務(wù):

有監(jiān)督學(xué)習(xí):輸入給計算機的示例帶有標(biāo)簽(期望輸出),基于標(biāo)簽調(diào)整建立的模型,以學(xué)習(xí)輸入到輸出的映射規(guī)則。

無監(jiān)督學(xué)習(xí):輸入給計算機的示例沒有標(biāo)簽,建立的模型必須通過自身學(xué)習(xí)產(chǎn)生輸出。無監(jiān)督學(xué)習(xí)涉及到從數(shù)據(jù)中發(fā)現(xiàn)隱藏的模式,包含特征學(xué)習(xí)。

機器學(xué)習(xí)這個術(shù)語對于大多非該領(lǐng)域的人來說聽起來很高級,但其實不然。只要你清楚機器學(xué)習(xí)的基本概念以及相關(guān)方法后,機器學(xué)習(xí)其實很簡單,即根據(jù)相關(guān)任務(wù),選擇合適的機器學(xué)習(xí)方法,讓機器學(xué)習(xí)并處理特征以完成相應(yīng)的任務(wù)。因此,在學(xué)習(xí)和應(yīng)用機器學(xué)習(xí)之前,我們首先應(yīng)該明確自己的任務(wù)是什么,以及適合使用哪種機器學(xué)習(xí)方法來完成。
如果我們想了解算法背后的基本理論以及其工作原理,那么精通概率與統(tǒng)計、線性代數(shù)和微積分對我們而言顯得至關(guān)重要。此外,了解諸如Python等編程語言將使你能夠容易得實現(xiàn)相關(guān)算法,理論基礎(chǔ)與編程能力二者在手,機器學(xué)習(xí)我有。此外,理解相關(guān)的數(shù)學(xué)知識和應(yīng)用也是很有必要的,無論是通過線下自學(xué)或者是網(wǎng)絡(luò)在線培訓(xùn)等學(xué)習(xí)方法,都必須實踐,實踐可以增加自己對基本知識的理解,同時也能鍛煉其編程能力。
在學(xué)習(xí)機器學(xué)習(xí)之前,掌握以下知識是很有必要的:

線性代數(shù)

微積分

概率論

程序設(shè)計

最優(yōu)化理論

下面是一些最常見的機器學(xué)習(xí)任務(wù)以及相關(guān)方法,對其理解后方便在后續(xù)工程中應(yīng)用。

回歸

回歸主要涉及連續(xù)變量或數(shù)值變量的估計,比如估計房價、股票價格、產(chǎn)品價格等使用回歸估計。即根據(jù)相關(guān)的數(shù)據(jù)建立回歸曲線,對新的數(shù)據(jù)進行預(yù)測估計。以下機器學(xué)習(xí)方法用于解決回歸問題:

核回歸(Kernel regression)

支持向量回歸(Support vector regression)

高斯過程回歸(Gaussian process regression)

線性回歸(Linear regression)

LASSO回歸(Least absolute shrinkage and selection operator)

回歸樹(Regression tree)

分類

分類與離散變量或數(shù)據(jù)類別的預(yù)測有關(guān)。比如區(qū)分垃圾郵件、病人患有哪種疾病、交易是否屬于欺詐行為等任務(wù),都是使用分類方法處理的。以下方法可以用于解決分類問題:

核判別分析(Kernel discriminant analysis)

人工神經(jīng)網(wǎng)絡(luò)(Artificial neural networks)

K鄰近算法(K-nearests neighbors)

Boosted trees

隨機森林(Random forests)

邏輯回歸(Logistic regression)

支持向量機(Support vector machine)

深度學(xué)習(xí)(Deep learning)

樸素貝葉斯(Naive Bayes)

決策樹(Decision trees)

聚類

聚類一般應(yīng)用于數(shù)據(jù)自然分組。比如產(chǎn)品特征識別、客戶細(xì)分等任務(wù)都是聚類的一些應(yīng)用場景。以下機器學(xué)習(xí)方法用于聚類問題:

均值漂移(Mean-shift)

K-均值(K-means)

主題模型(Topic models)

層次聚類(Hierarchical clustering)

多元查詢

多元查詢是用來尋找相似目標(biāo)。下面的方法可用于解決與多元查詢有關(guān)的問題:

近鄰取樣(Nearest neighbors)

最遠(yuǎn)鄰居(Farthest neighbors)

范圍搜索(Range search)

降維

降維是指降低多個隨機變量的維度,將其分為特征提取和特征選擇。常用的降維方法如下:

流線學(xué)習(xí)方法/核主成分分析(Manifold learning/KPCA)

獨立分量分析(Independent component analysis)

主成分分析(Principal component analysis)

非負(fù)矩陣分解(Non-negative matrix factorization)

壓縮感知(Compressed sensing)

高斯圖模型(Gaussian graphical models)

作者信息

Anusha Manchala,專注于機器學(xué)習(xí)、數(shù)據(jù)分析
本文由阿里云云棲社區(qū)組織翻譯。
文章原標(biāo)題《What You Must Know Before You Dive Into Machine Learning》,譯者:海棠,審校:Uncle_LLD。
詳情請閱讀原文

文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19739.html

相關(guān)文章

  • 一位技術(shù)校招生支付寶成長筆記

    摘要:但是,努力和幸運,讓魯直的人生軌跡逐漸發(fā)生變化。在中間件團隊年的挑戰(zhàn)與成長學(xué)習(xí)使人進步如愿以償,魯直進入了螞蟻金服中間件團隊,但這并不意味著是一片坦途。魯直告訴筆者,開源的意義就是給技術(shù)的發(fā)展裝上輪子。 哪有那么多的逆襲,唯有努力與堅持,機會就會在前方。 魯直,1989年生,本科畢業(yè)于浙江工業(yè)大學(xué),之后被校招進阿里巴巴。雖然,今年剛剛30歲,但他已是螞蟻金服SOFA中間件開源負(fù)責(zé)人。 ...

    Leo_chen 評論0 收藏0
  • 專訪第一代車間程序員:ET工業(yè)大腦數(shù)學(xué)博士夏分

    摘要:從數(shù)學(xué)博士到阿里云工程師,夏分一直學(xué)以致用。入職后的第個月,夏分接手了第一個項目,用工業(yè)大腦幫一家風(fēng)電企業(yè)提前預(yù)測風(fēng)電機組故障。一個萬千瓦的風(fēng)電場,平均每年維護費用高達(dá)萬元,還會以平均的速率逐年遞增。 從數(shù)學(xué)博士到阿里云工程師,夏分一直學(xué)以致用。加入阿里云接手的第一個ET工業(yè)大腦項目,因為數(shù)據(jù)傳輸問題丟失大量數(shù)據(jù),導(dǎo)致機器誤判拉響警報,這讓他意識到自己不能只坐在電腦前做碼農(nóng),也要下到車...

    h9911 評論0 收藏0
  • 開始第一個機器學(xué)習(xí)項目之就了解那些事兒

    摘要:此外,與訓(xùn)練機器學(xué)習(xí)模型的作業(yè)相比,作業(yè)具有不同的執(zhí)行配置文件。此外,還制作了一個界面,以便控制機器學(xué)習(xí)的參數(shù)指定用于訓(xùn)練的數(shù)據(jù)量等。 摘要: 一份機器學(xué)習(xí)過來人的經(jīng)驗清單分享,主要是包含一些關(guān)于構(gòu)建機器學(xué)習(xí)工作流以及Apache Spark應(yīng)該注意的一些事項,希望這個清單能夠幫助那些正在學(xué)習(xí)機器學(xué)習(xí)的相關(guān)人員少走一些彎路,節(jié)約一些時間。 showImg(https://segment...

    BearyChat 評論0 收藏0

發(fā)表評論

0條評論

moven_j

|高級講師

TA的文章

閱讀更多
最新活動
閱讀需要支付1元查看
<