摘要:微軟在大會上興奮地宣布了的預(yù)覽版,這是一種跨平臺的開源機器學(xué)習(xí)框架。核心組件作為的一部分而發(fā)布今天的代碼倉庫包含用于模型訓(xùn)練和使用的,以及許多常見的機器學(xué)習(xí)任務(wù)如回歸和分類所需要的各種轉(zhuǎn)換和學(xué)習(xí)器。
微軟在Build 2018大會上興奮地宣布了ML.NET的預(yù)覽版,這是一種跨平臺的開源機器學(xué)習(xí)框架。ML.NET將讓廣大.NET開發(fā)人員可以開發(fā)自己的模型,并且將自定義的機器學(xué)習(xí)融入到其應(yīng)用程序中,無需之前擁有開發(fā)或調(diào)整機器學(xué)習(xí)模型方面的專業(yè)知識。
ML.NET最初是在微軟研究中心開發(fā)而它的,在過去的十年已發(fā)展成為一種重要的框架;它用于微軟的許多產(chǎn)品組合中,比如Windows、Bing和Azure等。
有了這第一個預(yù)覽版,ML.NET能夠支持諸多機器學(xué)習(xí)任務(wù),比如說分類(比如文本分類和情緒分析)以及回歸(比如趨勢預(yù)測和價格預(yù)測)。除了這些機器學(xué)習(xí)功能外,ML.NET的這第一個版本還引入了訓(xùn)練模型的.NET API初稿,使用模型用于預(yù)測,還包括該框架的核心組件,比如學(xué)習(xí)算法、轉(zhuǎn)換和核心的機器學(xué)習(xí)數(shù)據(jù)結(jié)構(gòu)。
ML.NET首先是一個框架,這意味著它經(jīng)擴展后可以添加流行的機器學(xué)習(xí)庫,比如TensorFlow、Accord.NET和CNTK。我們致力于將開發(fā)ML.NET的內(nèi)部功能方面的全部經(jīng)驗帶給開源界的ML.NET。
綜上所述,ML.NET代表了我們致力于通過.NET讓機器學(xué)習(xí)變得很出色。
隨著時間的推移,ML.NET將充分利用流行的深度學(xué)習(xí)庫(比如TensorFlow、Caffe2和CNTK)以及一般的機器學(xué)習(xí)庫(比如Accord.NET),從而支持其他機器學(xué)習(xí)場景,比如推薦系統(tǒng)、異常檢測及其他方法(比如深度學(xué)習(xí))。
ML.NET還允許采用代碼優(yōu)先的方法,補充了Azure機器學(xué)習(xí)和認知服務(wù)提供的體驗,并支持應(yīng)用程序本地部署以及自行構(gòu)建模型的功能。
ML.NET核心組件
ML.NET作為.NET Foundation的一部分而發(fā)布;今天的代碼倉庫包含用于模型訓(xùn)練和使用的.NET C# API,以及許多常見的機器學(xué)習(xí)任務(wù)(如回歸和分類)所需要的各種轉(zhuǎn)換和學(xué)習(xí)器。
ML.NET旨在提供E2E工作流程,以便在預(yù)處理、特征工程、建模、評估和操作化等過程中將機器學(xué)習(xí)融入到.NET應(yīng)用程序中。
ML.NET本身支持機器學(xué)習(xí)各方面所需要的類型和運行時環(huán)境,包括核心數(shù)據(jù)類型、可擴展流水線、高性能數(shù)學(xué)、面向異構(gòu)數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)和工具支持等。
下面這張表顯示了作為ML.NET 0.1的一部分發(fā)布的完整組件列表。
我們旨在讓ML.NET的API具有通用性,那樣CNTK、Accord.NET和TensorFlow等其他框架以及其他庫就可以通過單一的共享式API來加以使用。
安裝入門
想開始使用ML.NET,請使用下列命令從CLI來安裝ML.NETNuGet:
從軟件包管理器來安裝:
您可以直接從https://github.com/dotnet/machinelearning來構(gòu)建框架。
借助ML.NET實現(xiàn)情緒分類
訓(xùn)練您自己的模型
這個簡單的代碼片段用來訓(xùn)練情緒分類模型(完整的代碼片段可在此:https://github.com/dotnet/machinelearning/blob/master/test/Microsoft.ML.Tests/Scenarios/Scenario3_SentimentPrediction.cs找到)。
讓我們更詳細地討論這個方面。我們創(chuàng)建了一個LearningPipeline,它將負責(zé)封裝數(shù)據(jù)加載、數(shù)據(jù)處理/特征化和學(xué)習(xí)算法。這些是訓(xùn)練機器學(xué)習(xí)模型所需要的幾個步驟,該模型讓我們得以拿來輸入數(shù)據(jù)后輸出預(yù)測結(jié)果。
這條流水線的第一部分是TextLoader,它將來自我們訓(xùn)練文件的數(shù)據(jù)加載到流水線。然后,我們使用TextFeaturizer將SentimentText列轉(zhuǎn)換成名為Features的數(shù)字向量,該數(shù)字向量可以被機器學(xué)習(xí)算法所使用(因為它無法接受文本輸入)。這是我們的預(yù)處理/特征化步驟。
FastTreeBinaryClassifier是我們將用于該流水線中的決策樹學(xué)習(xí)器。就像特征化步驟那樣,嘗試ML.NET中不同的學(xué)習(xí)器并更改其參數(shù)有望找到更好的結(jié)果。 PredictedLabelColumnOriginalValueConverter將模型的預(yù)測標簽轉(zhuǎn)換回成原始值/格式。
pipeline.Train
將經(jīng)過訓(xùn)練的模型用于預(yù)測
為了得到預(yù)測結(jié)果,我們對新數(shù)據(jù)使用model.Predict()。請注意,輸入數(shù)據(jù)是一個字符串,模型包含特征化,所以我們的流水線在訓(xùn)練和預(yù)測期間都保持同步。我們不必編寫專門用于預(yù)測的預(yù)處理/特征化代碼。
前方的道路
我們渴望將許多功能添加到ML.NET中,但我們很想了解哪些功能最適合您的要求。目前我們正在探索的領(lǐng)域包括:
另外的機器學(xué)習(xí)任務(wù)和場景
使用TensorFlow和CNTK的深度學(xué)習(xí)
ONNX支持
在Azure上橫向擴展
更好的GUI,以簡化機器學(xué)習(xí)任務(wù)
與VS工具集成,用于AI
針對.NET的語言創(chuàng)新
歡迎加入本站公開興趣群商業(yè)智能與數(shù)據(jù)分析群
興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法,實際應(yīng)用案例分享與討論,分析工具,ETL工具,數(shù)據(jù)倉庫,數(shù)據(jù)挖掘工具,報表系統(tǒng)等全方位知識
QQ群:81035754
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/4759.html
摘要:十三套框架助你玩轉(zhuǎn)機器學(xué)習(xí)技術(shù)在今天的文章中,我們將共同了解十三款機器學(xué)習(xí)框架,一部分去年剛剛發(fā)布另一部分則在不久前進行了全部升級。目前該項目正積極添加對的支持能力,不過此類項目一般更傾向于直接面向各承載機器學(xué)習(xí)任務(wù)的主流環(huán)境。 導(dǎo)讀過去幾年以來,機器學(xué)習(xí)已經(jīng)開始以前所未有的方式步入主流層面。這種趨勢并非單純由低成本云環(huán)境乃至極為強大的GPU硬件所推動; 除此之外,面向機器學(xué)習(xí)的可用框架也迎...
摘要:年月宣布支持時間延長到年。更詳細的發(fā)布列表參閱官網(wǎng)的版本號分為三段,形如。其中表示大版本號,一般當(dāng)整體重寫,或出現(xiàn)不向后兼容的改變時,增加表示功能更新,出現(xiàn)新功能時增加表示小的改動如修復(fù)了某個,只要有修改就增加。年公司正式發(fā)布。 < 返回索引頁 Python語言簡介 Python介紹及發(fā)展 介紹 Python 官方網(wǎng)站:https://www.python.org/, 大家可以到此處下...
摘要:對云術(shù)語模糊不清我們可以幫你厘清網(wǎng)站從到的云計算術(shù)語表對最流行的云計算術(shù)語逐一進行了定義。云計算云計算通過網(wǎng)絡(luò)通常是互聯(lián)網(wǎng)交付信息技術(shù)服務(wù)。云計算常常被稱為是一種顛覆性技術(shù)。 對云術(shù)語模糊不清?我們可以幫你厘清!Solutions Review網(wǎng)站從A到Z的云計算IT術(shù)語表對最流行的云計算術(shù)語逐一進行了定義。A基于廣告的定價模式――這種定價模式將服務(wù)低價或免費提供給客戶,因廣告連同服務(wù)提供給...
閱讀 2866·2021-10-21 09:38
閱讀 2764·2021-10-11 10:59
閱讀 3057·2021-09-27 13:36
閱讀 1673·2021-08-23 09:43
閱讀 806·2019-08-29 14:14
閱讀 3044·2019-08-29 12:13
閱讀 3212·2019-08-29 12:13
閱讀 319·2019-08-26 12:24