深度學(xué)習(xí)初學(xué)者必讀：張量究竟是什么？

binta 發(fā)布于2019-04-25 18:14 / 2216人閱讀

摘要：近段時間以來，張量與新的機(jī)器學(xué)習(xí)工具如是非常熱門的話題，在那些尋求應(yīng)用和學(xué)習(xí)機(jī)器學(xué)習(xí)的人看來更是如此。計(jì)算機(jī)之所以可憑極快速度求出用線性代數(shù)編寫的程序值，部分原因是線性代數(shù)具有規(guī)律性。但是，我們沒有必要把自己限制在線性代數(shù)上。

近段時間以來，張量與新的機(jī)器學(xué)習(xí)工具（如 TensorFlow）是非常熱門的話題，在那些尋求應(yīng)用和學(xué)習(xí)機(jī)器學(xué)習(xí)的人看來更是如此。但是，當(dāng)你回溯歷史，你會發(fā)現(xiàn)一些基礎(chǔ)但強(qiáng)大的、有用且可行的方法，它們也利用了張量的能力，而且不是在深度學(xué)習(xí)的場景中。下面會給出具體解釋。

如果說計(jì)算是有傳統(tǒng)的，那么使用線性代數(shù)的數(shù)值計(jì)算就是其中最重要的一支。像 LINPACK 和 LAPACK 這樣的包已經(jīng)是非常老的了，但是在今天它們?nèi)稳环浅?qiáng)大。其核心，線性代數(shù)由非常簡單且常規(guī)的運(yùn)算構(gòu)成，它們涉及到在一維或二維數(shù)組（這里我們稱其為向量或矩陣）上進(jìn)行重復(fù)的乘法和加法運(yùn)算。同時線性代數(shù)適用范圍異常廣泛，從計(jì)算機(jī)游戲中的圖像渲染到核武器設(shè)計(jì)等許多不同的問題都可以被它解決或近似計(jì)算，

關(guān)鍵的線性代數(shù)運(yùn)算：在計(jì)算機(jī)上使用的最基礎(chǔ)的線性代數(shù)運(yùn)算是兩個向量的點(diǎn)積（dot product）。這種點(diǎn)積僅僅是兩個向量中相關(guān)元素的乘積和。一個矩陣和一個向量的積可以被視為該矩陣和向量行（row）的點(diǎn)積，兩個矩陣的乘積可以被視為一個矩陣和另一個矩陣的每一列（column）進(jìn)行的矩陣-向量乘積的和。此外，再配上用一個值對所有元素進(jìn)行逐一的加法和乘法，我們可以構(gòu)造出所需要的線性代數(shù)運(yùn)算機(jī)器。

計(jì)算機(jī)之所以可憑極快速度求出用線性代數(shù)編寫的程序值，部分原因是線性代數(shù)具有規(guī)律性。此外，另一個原因是它們可以大量地被并行處理。完全就潛在性能而言，從早期的 Cray-1（譯者注：Cary-1 是世界上最早的一臺超級計(jì)算機(jī)，于 1975 年建造，運(yùn)算速度每秒 1 億次）到今天的 GPU 計(jì)算機(jī)，我們可以發(fā)現(xiàn)性能增長了超過 30000 倍。此外，當(dāng)你要考慮用大量 GPU 處理集群數(shù)據(jù)時，其潛在的性能，在極小成本下，比曾經(jīng)世上最快速的計(jì)算機(jī)大約高出一百萬倍。

然而，歷史的模式總是一致的，即要想充分利用新的處理器，我們就要讓運(yùn)算越來越抽象。Cray-1 和它向量化的后繼者們需要其運(yùn)行程序能夠使用向量運(yùn)算（如點(diǎn)積）才能發(fā)揮出硬件的全部性能。后來的機(jī)器要求要就矩陣-向量運(yùn)算或矩陣-矩陣運(yùn)算來將算法形式化，從而方可盡可能地發(fā)揮硬件的價值。

我們現(xiàn)在正站在這樣一個結(jié)點(diǎn)上。不同的是我們沒有任何超越矩陣-矩陣運(yùn)算的辦法，即：我們對線性代數(shù)的使用已達(dá)極限。

但是，我們沒有必要把自己限制在線性代數(shù)上。事實(shí)證明，我們可以沿著數(shù)學(xué)這棵大樹的枝葉往上再爬一段。長期以來，人們都知道在數(shù)學(xué)抽象的海洋中存在著比矩陣還要大的魚，這其中一個候選就是張量（tensor）。張量是廣義相對論重要的數(shù)學(xué)基礎(chǔ)，此外它對于物理學(xué)的其它分支來說也具有基礎(chǔ)性的地位。那么如同數(shù)學(xué)的矩陣和向量概念可被簡化成我們在計(jì)算機(jī)中使用的數(shù)組一樣，我們是否可以將張量也簡化和表征成多維數(shù)組和一些相關(guān)的運(yùn)算呢？很不幸，事情沒有那么簡單，這其中的主要原因是不存在一個顯而易見且簡單的（如在矩陣和向量上類似的）可在張量上進(jìn)行的一系列運(yùn)算。

然而，也有好消息。雖然我們不能對張量使用僅幾個運(yùn)算。但是我們可以在張量上寫下一套運(yùn)算的模式（pattern）。不過，這還不不夠，因?yàn)楦鶕?jù)這些模式編寫的程序不能像它們寫的那樣被充分高效地執(zhí)行。但我們還有另外的好消息：那些效率低下但是編寫簡單的程序可以被（基本上）自動轉(zhuǎn)換成可非常高效執(zhí)行的程序。

更贊的是，這種轉(zhuǎn)換可以無需構(gòu)建一門新編程語言就能實(shí)現(xiàn)。只需要一個簡單的技巧就可以了，當(dāng)我們在 TensorFlow 中寫下如下代碼時：

v1 = tf.constant(3.0)

v2 = tf.constant(4.0)

v3 = tf.add(node1, node2)

實(shí)際情況是，系統(tǒng)將建立一個像圖 1 中顯示的數(shù)據(jù)結(jié)構(gòu)：

圖 1：上方的代碼被轉(zhuǎn)譯成一個可被重建的數(shù)據(jù)結(jié)構(gòu)，而且它會被轉(zhuǎn)成機(jī)器可執(zhí)行的形式。將代碼轉(zhuǎn)譯成用戶可見的數(shù)據(jù)結(jié)構(gòu)可讓我們所編寫的程序能被重寫從而更高效地執(zhí)行，或者它也可以計(jì)算出一個導(dǎo)數(shù)，從而使高級優(yōu)化器可被使用。

該數(shù)據(jù)結(jié)構(gòu)不會在上面我們展示的程序中實(shí)際執(zhí)行。因此，TensorFlow 才有機(jī)會在我們實(shí)際運(yùn)行它之前，將數(shù)據(jù)結(jié)構(gòu)重寫成更有效的代碼。這也許會牽涉到我們想讓計(jì)算機(jī)處理的小型或大型結(jié)構(gòu)。它也可生成對我們使用的計(jì)算機(jī) CPU、使用的集群、或任何手邊可用的 GPU 設(shè)備實(shí)際可執(zhí)行的代碼。對它來說很贊的一點(diǎn)是，我們可以編寫非常簡單但可實(shí)現(xiàn)令人意想不到結(jié)果的程序。

然而，這只是開始。

做一些有用但不一樣的事

TensorFlow 和像它一樣的系統(tǒng)采用的完全是描述機(jī)器學(xué)習(xí)架構(gòu)（如深度神經(jīng)網(wǎng)絡(luò)）的程序，然后調(diào)整那個架構(gòu)的參數(shù)以最小化一些誤差值。它們通過創(chuàng)建一個表征我們程序的數(shù)據(jù)結(jié)構(gòu)，和一個表征相對于我們模型所有參數(shù)誤差值梯度的數(shù)據(jù)結(jié)構(gòu)來實(shí)現(xiàn)這一點(diǎn)。這個梯度函數(shù)的存在使得優(yōu)化變得更加容易。

但是，雖然你可以使用 TensorFlow 或 Caffe 或任何其它基本上同樣工作模式的架構(gòu)來寫程序，不過你寫的程序不一定要去優(yōu)化機(jī)器學(xué)習(xí)函數(shù)。如果你寫的程序使用了由你選擇的包（package）提供的張量標(biāo)注，那它就可以優(yōu)化所有類型的程序。自動微分和較先進(jìn)的優(yōu)化器以及對高效 GPU 代碼的編譯對你仍然有利。

舉個簡例，圖二給出了一個家庭能耗的簡單模型。

圖 2：該圖顯示了一間房子的日常能耗情況（圓圈），橫軸代表了溫度（華氏度）。能耗的一個分段線性模型疊加在了能耗具體數(shù)據(jù)上。模型的參數(shù)按理來說會形成一個矩陣，但是當(dāng)我們要處理上百萬個模型時，我們便可以用到張量。

該圖顯示了一間房子的能耗使用情況，并對此進(jìn)行了建模。得到一個模型不是什么難事，但是為了找出這個模型，筆者需要自己寫代碼來分別對數(shù)百萬間房子的能耗情況進(jìn)行建模才行。如果使用 TensorFlow，我們可以立即為所有這些房子建立模型，并且我們可以使用比之前得到這個模型更有效的優(yōu)化器。于是，筆者就可以立即對數(shù)百萬個房間的模型進(jìn)行優(yōu)化，而且其效率比之前我們原始的程序要高得多。理論上我們可以手動優(yōu)化代碼，并且可以有人工推導(dǎo)的導(dǎo)數(shù)函數(shù)。不過完成這項(xiàng)工作所需要的時間，以及更重要的，調(diào)試花費(fèi)的時間會讓筆者無法在有限時間里建立這個模型。

這個例子為我們展示了一個基于張量的計(jì)算系統(tǒng)如 TensorFlow（或 Caffe 或 Theano 或 MXNet 等等）是可以被用于和深度學(xué)習(xí)非常不同的優(yōu)化問題的。

所以，情況可能是這樣的，對你而言較好用的機(jī)器學(xué)習(xí)軟件除了完成機(jī)器學(xué)習(xí)功能以外還可以做很多其它事情。

原文鏈接：http://www.kdnuggets.com/2017/06/deep-learning-demystifying-tensors.html

歡迎加入本站公開興趣群

商業(yè)智能與數(shù)據(jù)分析群

興趣范圍包括各種讓數(shù)據(jù)產(chǎn)生價值的辦法，實(shí)際應(yīng)用案例分享與討論，分析工具，ETL工具，數(shù)據(jù)倉庫，數(shù)據(jù)挖掘工具，報表系統(tǒng)等全方位知識

QQ群：81035754

GPU云服務(wù)器云服務(wù)器云計(jì)算究竟是什么物聯(lián)網(wǎng)究竟是什么區(qū)塊鏈究竟是什么深度學(xué)習(xí)初學(xué)者

文章版權(quán)歸作者所有，未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為，您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請注明本文地址：http://systransis.cn/yun/4563.html

發(fā)表評論

登陸后可評論

0條評論

binta

男|高級講師

我要關(guān)注我要私信

TA的文章

tensorflow如何使用

閱讀 2278·2023-04-25 23:15
效率倍增，PyCaret：一個開源、低代碼的 Python 機(jī)器學(xué)習(xí)工具

閱讀 1943·2021-11-22 09:34
python scrapy 代理中間件，爬蟲必掌握的內(nèi)容之一

閱讀 1564·2021-11-15 11:39
傳感與檢測技術(shù)，Pt100熱電阻測溫實(shí)驗(yàn)報告，江南大學(xué)物聯(lián)網(wǎng)

閱讀 972·2021-11-15 11:37
C語言進(jìn)階：程序預(yù)處理

閱讀 2166·2021-10-14 09:43
CYUN：國慶鉅惠！美國CERA高防云服務(wù)器、香港CN2 GIA云服務(wù)器最低5折起

閱讀 3506·2021-09-27 13:59
重溫 Flex 布局

閱讀 1517·2019-08-30 15:43
一步步教你用 CSS 為 SVG 添加濾鏡

閱讀 3480·2019-08-30 15:43

成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

上云采購季！| 2核2G4M爆款云服務(wù)器低至59元/年，更有多臺、長期優(yōu)惠，快來選購！

深度學(xué)習(xí)初學(xué)者必讀：張量究竟是什么？

相關(guān)文章