摘要:雖然廣受歡迎,但是仍受到來自另外一個基于的機器學習庫的競爭年出現(xiàn)的。還提供更傳統(tǒng)的機器學習功能的庫,包括神經(jīng)網(wǎng)絡(luò)和決策樹系統(tǒng)。和的機器學習庫。顧名思義,是用于神經(jīng)網(wǎng)絡(luò)機器學習的庫,便于將瀏覽器用作數(shù)據(jù)工作臺。
關(guān)于機器學習的11個開源工具
翻譯:瘋狂的技術(shù)宅
英文標題:11 open source tools to make the most of machine learning
英文連接:https://www.infoworld.com/art...
本文首發(fā)于微信公眾號:充實的腦洞
使用這些多樣化、易于實現(xiàn)的庫和框架,挖掘機器學習的預(yù)測能力
垃圾郵件過濾,人臉識別,推薦引擎 —— 當你有一個需要執(zhí)行預(yù)測分析或模式識別的大型數(shù)據(jù)集時,機器學習是一條途徑。 免費開源軟件的激增使機器學習更容易在單機和大規(guī)模集群上實現(xiàn),并支持大多數(shù)流行的編程語言。這11個開源工具使用的語言包括Python,R,C ++,Java, Scala,Clojure,JavaScript和Go。
1、Scikit-learnPython因為它的易用性,已經(jīng)成為一種用于數(shù)學、科學和統(tǒng)計的編程語言,而且?guī)缀跞魏纬绦蚨伎梢允褂眠@些庫。Scikit-learn 通過在幾個現(xiàn)有的 python 包( NumPy, SciPy 和 Matplotlib )可以被廣泛用于數(shù)學和科學工作。它可以被用在交互式“工作臺”程序中,也可以嵌入到其他軟件中并被重用。該工具包在BSD許可證下提供,因此它是完全開放和可重用的。
Project: http://scikit-learn.org/stable/
GitHub: https://github.com/scikit-lea...
著名的Shogun創(chuàng)建于1999年,盡管它是用C++編寫的,但可以與Java,Python,C#,Ruby,R,Lua,Octave和Matlab一起使用。最新版本 6.0.0 增加了對Microsoft Windows和Scala語言的本地支持。
雖然廣受歡迎,但是 Shogun 仍受到來自另外一個基于C++的機器學習庫的競爭:2011年出現(xiàn)的Mlpack。但是Shogun仍然自稱是比其他競爭者更快更易用的(通過一個更完整的API集)。
Project: http://www.shogun-toolbox.org/
GitHub: https://github.com/shogun-too...
Accord是一個機器學習和信號處理框架,基于.Net編寫,是以前的項目AForge.net的延伸,Accord包括一組用于處理音頻信號和圖像流(例如視頻)的庫。其視覺處理算法可用于臉部識別,拼接圖像或跟蹤移動物體等任務(wù)。
Accord還提供更傳統(tǒng)的機器學習功能的庫,包括神經(jīng)網(wǎng)絡(luò)和決策樹系統(tǒng)。
Project: http://accord-framework.net/
GitHub: https://github.com/accord-net...
Apache Mahout長期以來一直被綁定到Hadoop,但是其中的許多算法也可以脫離 Hadoop 運行。 這對可能最終遷移到 Hadoop 項目中的獨立應(yīng)用非常有用,這些項目最終可能會被剝離到自己的獨立應(yīng)用中。最后幾個版本加強了對高性能 Spark 框架的支持,并增加了對用于 GPU 加速的 ViennaCL 庫的支持。
Project: https://mahout.apache.org/
5、Spark MLlibApache Spark 和 Apache Hadoop 的機器學習庫。MLLib擁有許多最新的常用算法和有用的數(shù)據(jù)類型,為速度和大規(guī)模運行需求所設(shè)計。雖然 Java 是 MLLib 的主要工作語言,但 Python 用戶可以將 MLLib 與 Numpy 庫整合,Scala用戶可以編寫針對MLLib的代碼,而R用戶可以嵌入到在 Spark 1.5 之后的版本中。
在MLLib的基礎(chǔ)之上構(gòu)建的項目MLbase可以更容易得到結(jié)果。 用戶無需編寫代碼,只需要通過聲明語言(à la SQL)進行查詢。
Project: https://spark.apache.org/mllib/
6、H2OH2O的算法針對業(yè)務(wù)流程(例如欺詐或趨勢預(yù)測)而不是圖像分析。H2O能夠以獨立的方式與HDFS、YARN、MapReduce或者直接在Amazon EC2實例進行交互。Hadoop專家可以使用Java與H2O交互,該框架還提供了Python、R 和 Scala 的綁定方式,允許你與這些平臺上的所有庫進行交互。
Project: http://0xdata.com/h2o/
GitHub: https://github.com/0xdata/h2o
Oryx,由 Cloudera Hadoop distribution 的創(chuàng)始人提供,通過Spark和Kafka流處理框架來運行機器學習模型中的實時數(shù)據(jù)。Oryx 提供了一種需要在當下做出決定的項目構(gòu)建方法,如推薦引擎或?qū)崟r異常檢測。 2.0版本做了近乎完整的重新設(shè)計,其組件在 lambda 體系結(jié)構(gòu)下進行松散耦合??梢噪S時添加新算法以及這些算法的新的抽象 (例如 hyperparameter 選擇器),。
Project:?Cloudera Oryx
GitHub: https://github.com/cloudera/oryx
GoLearn 是一個由Go語言編寫的機器學習庫, 根據(jù)開發(fā)者 Stephen Whitworth 的研究, 它以簡潔性和可定制性為目標。簡潔性在于在庫中加載和處理數(shù)據(jù)的方式, 這點模仿了 SciPy 和 R ??啥ㄖ菩栽谟谌绾卧趹?yīng)用程序中輕松擴展某些數(shù)據(jù)結(jié)構(gòu)。Stephen Whitworth 還為 Vowpal Wabbit 庫創(chuàng)建了一個gGo包裝器,它可以在Shogun工具箱中找到。
Project: GoLearn
GitHub: https://github.com/sjwhitwort...
Weka是專門為數(shù)據(jù)挖掘而設(shè)計的一套Java機器學習算法。它有一個包系統(tǒng)用來擴展功能,被包含在官方和非官方包中。 Weka甚至提供了一本書來解釋這個軟件及其所使用的技術(shù)。
雖然 Weka 不是專門針對 Hadoop 用戶的,但最近的版本提供了一組包裝器使其可以與 Hadoop 一起使用。 請注意,Weka尚不支持 Spark,目前只支持 MapReduce。 Clojure 用戶可以通過Clj-ml庫來使用Weka。
Project: http://www.cs.waikato.ac.nz/m...
10、Deeplearn.js在web瀏覽器中進行深度學習的另一個項目是deeplearn.js,它來自Google。你可以在任何現(xiàn)代瀏覽器中直接訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,而無需額外的客戶端軟件。deeplearn.js還可以通過web GLAPI進行GPU加速,因此性能不受限于系統(tǒng)的CPU。該項目的函數(shù)模仿了Google 的TensorFlow,使得TensorFlow的用戶可以輕松地開始使用。
Project: https://pair-code.github.io/d...
11、ConvNetJS顧名思義,ConvNetJS是用于神經(jīng)網(wǎng)絡(luò)機器學習的JavaScript庫,便于將瀏覽器用作數(shù)據(jù)工作臺。 對于使用Node.js的用戶,還可以使用NPM版本,該庫的設(shè)計使用了JavaScript的異步操作。例如,訓(xùn)練完成后執(zhí)行一個回調(diào)。它包括了大量演示示例。
Project: http://cs.stanford.edu/people...
GitHub: https://github.com/karpathy/c...
關(guān)注微信公眾號:充實的腦洞, 一個技術(shù)宅的保留地 | |
---|---|
文章版權(quán)歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://systransis.cn/yun/19647.html
摘要:正在失業(yè)中的課多周刊第期我們的微信公眾號,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。若有幫助,請把課多周刊推薦給你的朋友,你的支持是我們最大的動力。是一種禍害譯本文淺談了在中關(guān)于的不好之處。淺談超時一運維的排查方式。 正在失業(yè)中的《課多周刊》(第3期) 我們的微信公眾號:fed-talk,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。 若有幫助,請把 課多周刊 推薦給你的朋友,你的支持是我們最大的...
摘要:正在失業(yè)中的課多周刊第期我們的微信公眾號,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。若有幫助,請把課多周刊推薦給你的朋友,你的支持是我們最大的動力。是一種禍害譯本文淺談了在中關(guān)于的不好之處。淺談超時一運維的排查方式。 正在失業(yè)中的《課多周刊》(第3期) 我們的微信公眾號:fed-talk,更多精彩內(nèi)容皆在微信公眾號,歡迎關(guān)注。 若有幫助,請把 課多周刊 推薦給你的朋友,你的支持是我們最大的...
摘要:業(yè)界動態(tài)發(fā)布版本,同時發(fā)布了版本以及首個穩(wěn)定版本的。程序人生如何用人類的方式進行二關(guān)于如何在中進行良好的溝通,避免陷入一些潛在的陷阱。技術(shù)周刊由小組出品,匯聚一周好文章,周刊原文。 業(yè)界動態(tài) Angular 5.1 & More Now Available Angular發(fā)布5.1版本,同時發(fā)布了Angular CLI 1.6版本以及首個穩(wěn)定版本的Angular Material。CL...
閱讀 2922·2023-04-26 02:14
閱讀 3773·2019-08-30 15:55
閱讀 1861·2019-08-29 16:42
閱讀 2772·2019-08-26 11:55
閱讀 2858·2019-08-23 13:38
閱讀 499·2019-08-23 12:10
閱讀 1322·2019-08-23 11:44
閱讀 2829·2019-08-23 11:43