摘要:由于機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù)大量的數(shù)據(jù)很常見(jiàn)的是,人們?cè)絹?lái)越擔(dān)心已經(jīng)擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大。事實(shí)上,機(jī)器學(xué)習(xí)的傳播并不意味著谷歌變得更強(qiáng)大,但各種各樣的創(chuàng)業(yè)公司都可以比以前更快地用這種前沿科學(xué)建立事物。
機(jī)器學(xué)習(xí)可能是當(dāng)今技術(shù)中最重要的基本趨勢(shì)。由于機(jī)器學(xué)習(xí)的基礎(chǔ)是數(shù)據(jù) - 大量的數(shù)據(jù) - 很常見(jiàn)的是,人們?cè)絹?lái)越擔(dān)心已經(jīng)擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大。這有一定的道理,但是以相當(dāng)狹窄的方式,同時(shí)ML也看到了很多能力的擴(kuò)散 - 可能存在與集中化一樣多的分散化。
首先,說(shuō)機(jī)器學(xué)習(xí)是關(guān)于數(shù)據(jù)的意思是什么?由于ML的學(xué)術(shù)文化,幾乎所有的初級(jí)科學(xué)都是在創(chuàng)建之后發(fā)布的 - 幾乎所有新的都是一篇你可以閱讀和構(gòu)建的論文。但是你建造什么?那么,在過(guò)去,如果軟件工程師想要?jiǎng)?chuàng)建一個(gè)系統(tǒng)來(lái)識(shí)別某些東西,他們就會(huì)編寫(xiě)邏輯步驟(“規(guī)則”)。要識(shí)別圖片中的貓,你會(huì)編寫(xiě)規(guī)則來(lái)查找邊緣,毛發(fā),腿,眼睛,尖耳等等,并將它們?nèi)科唇釉谝黄鸩⑾M軌蛘9ぷ鳌B闊┑氖?,雖然這在理論上是有效的,但在實(shí)踐中它更像是試圖制造機(jī)械馬 - 這在理論上是可行的,但所需復(fù)雜性的法令是不切實(shí)際的。我們實(shí)際上無(wú)法描述我們用于行走或識(shí)別貓的所有邏輯步驟。通過(guò)機(jī)器學(xué)習(xí),您可以向統(tǒng)計(jì)引擎提供示例(大量示例),而不是編寫(xiě)規(guī)則,并且該引擎會(huì)生成可以區(qū)分的模型。你給它10萬(wàn)張標(biāo)有"cat"的照片和100,000張標(biāo)有"no cat"的照片,然后機(jī)器計(jì)算出差異。 ML用自動(dòng)確定的數(shù)據(jù)模式取代了手寫(xiě)的邏輯步驟,并且對(duì)于一個(gè)非常廣泛的問(wèn)題更加有效 - 簡(jiǎn)單的演示在于計(jì)算機(jī)視覺(jué),語(yǔ)言和語(yǔ)音,但用例更廣泛。您需要多少數(shù)據(jù)才是移動(dòng)目標(biāo):有研究途徑允許ML使用更小的數(shù)據(jù)集,但就目前而言,(更多)數(shù)據(jù)幾乎總是更好。
因此,問(wèn)題是:如果ML讓你做新的和重要的事情,而ML會(huì)更好,你擁有的數(shù)據(jù)越多,那么這意味著那些已經(jīng)很大且擁有大量數(shù)據(jù)的公司會(huì)變得更強(qiáng)大了多遠(yuǎn)?贏家通吃效果有多遠(yuǎn)?很容易想象良性循環(huán)強(qiáng)化了贏家:"更多數(shù)據(jù)=更準(zhǔn)確的模型=更好的產(chǎn)品=更多的用戶(hù)=更多的數(shù)據(jù)"。從這里開(kāi)始,這是“Google / Facebook /亞馬遜擁有所有數(shù)據(jù)”或“中國(guó)擁有所有數(shù)據(jù)”等聲明的一個(gè)簡(jiǎn)單步驟 - 擔(dān)心最強(qiáng)大的科技公司會(huì)變得更強(qiáng)大,人口眾多的國(guó)家也會(huì)變得更加強(qiáng)大"對(duì)集中使用數(shù)據(jù)的態(tài)度。
好吧,有點(diǎn)。
首先,雖然您需要大量的機(jī)器學(xué)習(xí)數(shù)據(jù),但您使用的數(shù)據(jù)非常特定于您嘗試解決的問(wèn)題。通用電氣擁有大量來(lái)自燃?xì)廨啓C(jī)的遙測(cè)數(shù)據(jù),谷歌擁有大量搜索數(shù)據(jù),而美國(guó)運(yùn)通有很多信用卡欺詐數(shù)據(jù)。您不能使用渦輪機(jī)數(shù)據(jù)作為例子來(lái)發(fā)現(xiàn)欺詐性交易,并且您無(wú)法使用網(wǎng)絡(luò)搜索來(lái)發(fā)現(xiàn)即將發(fā)生故障的燃?xì)廨啓C(jī)。也就是說(shuō),ML是一種可推廣的技術(shù) - 您可以將其用于欺詐檢測(cè)或人臉識(shí)別 - 但您使用它構(gòu)建的應(yīng)用程序并不是一般化的。你構(gòu)建的每件事只能做一件事。這與之前的所有自動(dòng)化浪潮大致相同:就像洗衣機(jī)只能洗衣服而不洗碗或做飯一樣,國(guó)際象棋程序不能免稅,機(jī)器學(xué)習(xí)翻譯系統(tǒng)無(wú)法識(shí)別貓。您構(gòu)建的應(yīng)用程序和您需要的數(shù)據(jù)集都非常特定于您嘗試解決的任務(wù)(盡管如此,這是一個(gè)移動(dòng)目標(biāo),并且正在進(jìn)行研究以嘗試使學(xué)習(xí)在不同數(shù)據(jù)集之間更易于轉(zhuǎn)換)。
這意味著機(jī)器學(xué)習(xí)的實(shí)現(xiàn)將得到非常廣泛的分布。谷歌不會(huì)“擁有所有數(shù)據(jù)” - 谷歌將擁有所有谷歌數(shù)據(jù)。谷歌將擁有更多相關(guān)的搜索結(jié)果,通用電氣將擁有更好的引擎遙測(cè)技術(shù),沃達(dá)豐將更好地分析通話(huà)模式和網(wǎng)絡(luò)規(guī)劃,這些都是由不同公司構(gòu)建的不同內(nèi)容。谷歌更善于成為谷歌,但這并不意味著它在某種程度上擅長(zhǎng)于其他任何事情。
接下來(lái),人們可以爭(zhēng)辯說(shuō),這只意味著每個(gè)行業(yè)中的大公司都會(huì)變得更強(qiáng)大 - 沃達(dá)豐,通用電氣和美國(guó)運(yùn)通各自擁有“所有數(shù)據(jù)”,無(wú)論他們做什么,因此形成了對(duì)抗競(jìng)爭(zhēng)的護(hù)城河。但在這里,它更復(fù)雜:有各種有趣的問(wèn)題,關(guān)于誰(shuí)擁有數(shù)據(jù),它的獨(dú)特性以及它的獨(dú)特性,以及正確的聚合和分析點(diǎn)。
那么:作為一家工業(yè)公司,您是否保留自己的數(shù)據(jù)并構(gòu)建ML系統(tǒng)進(jìn)行分析(或者向承包商支付費(fèi)用為您做到這一點(diǎn))?您是否從已經(jīng)接受過(guò)其他人數(shù)據(jù)培訓(xùn)的供應(yīng)商那里購(gòu)買(mǎi)成品?您是將您的數(shù)據(jù)混合到那里,還是從它衍生出的培訓(xùn)中混合?供應(yīng)商是否需要您的數(shù)據(jù),或者他們已經(jīng)擁有足夠的數(shù)據(jù)?答案在您的業(yè)務(wù)的不同部分,不同的行業(yè)和不同的用例中會(huì)有所不同。
從另一端來(lái)看,如果您正在創(chuàng)建一家公司來(lái)部署ML來(lái)解決實(shí)際問(wèn)題,那么有兩個(gè)基本數(shù)據(jù)問(wèn)題:如何獲得第一個(gè)數(shù)據(jù)來(lái)訓(xùn)練模型以獲得第一個(gè)客戶(hù),你實(shí)際需要多少數(shù)據(jù)?當(dāng)然,第二個(gè)問(wèn)題分解為很多問(wèn)題:?jiǎn)栴}是通過(guò)相對(duì)少量的數(shù)據(jù)解決的,你可以很容易地獲得(但許多競(jìng)爭(zhēng)對(duì)手可以獲得),或者你需要更多,難以獲得數(shù)據(jù),如果是這樣,網(wǎng)絡(luò)效應(yīng)可以從中受益,那么勝利者會(huì)采取一切動(dòng)態(tài)嗎?產(chǎn)品是否會(huì)無(wú)限期地獲得更多數(shù)據(jù),或者是否存在S曲線?
這取決于。
某些數(shù)據(jù)對(duì)于業(yè)務(wù)或產(chǎn)品而言是獨(dú)一無(wú)二的,或者具有強(qiáng)大的專(zhuān)有優(yōu)勢(shì)。 GE發(fā)動(dòng)機(jī)遙測(cè)可能沒(méi)有太多用于分析勞斯萊斯發(fā)動(dòng)機(jī),但如果是,他們將不會(huì)分享它。這可能是公司創(chuàng)建的機(jī)會(huì),但也是許多內(nèi)部大公司IT和承包商項(xiàng)目發(fā)生的地方
一些數(shù)據(jù)將適用于許多公司甚至許多行業(yè)中的用例。 “這個(gè)電話(huà)有些奇怪”可能是所有信用卡公司的常見(jiàn)分析 - “客戶(hù)聽(tīng)起來(lái)很生氣”可能適用于有呼叫中心的任何人。這是“混合”的問(wèn)題。在這里創(chuàng)建了許多公司來(lái)解決許多公司或不同行業(yè)的問(wèn)題,這里的數(shù)據(jù)存在網(wǎng)絡(luò)效應(yīng)。
但也有一些情況,在某一點(diǎn)之后,供應(yīng)商甚至不需要每個(gè)增量客戶(hù)的數(shù)據(jù) - 產(chǎn)品已經(jīng)在運(yùn)行。
實(shí)際上,隨著機(jī)器學(xué)習(xí)幾乎擴(kuò)散到所有東西,一個(gè)初創(chuàng)公司可能會(huì)看到其中的幾個(gè)。我們的投資組合公司Everlaw生產(chǎn)法律發(fā)現(xiàn)軟件:如果你起訴某人并且他們給你發(fā)了一輛裝滿(mǎn)紙的卡車(chē),這會(huì)有所幫助。機(jī)器學(xué)習(xí)意味著他們將能夠?qū)σ话偃f(wàn)封電子郵件進(jìn)行情緒分析(“向我顯示焦慮的電子郵件”),而無(wú)需根據(jù)案例中的數(shù)據(jù)訓(xùn)練該模型,因?yàn)榕嘤?xùn)該模型的情緒示例不需要來(lái)自這一特定訴訟(或任何訴訟)。相反,他們也可以對(duì)您的數(shù)據(jù)進(jìn)行聚類(lèi)分析(“向我顯示與此相同的電子郵件”),而不會(huì)在其他任何地方進(jìn)行。另一家投資組合公司Drishti使用計(jì)算機(jī)視覺(jué)來(lái)檢測(cè)和分析生產(chǎn)線 - 其中一些功能是根據(jù)您的數(shù)據(jù)進(jìn)行培訓(xùn)的,有些功能根本不是針對(duì)您的業(yè)務(wù),而是跨行業(yè)。
在極端情況下,我最近采訪了一家非常大型車(chē)輛的制造商,他們正在使用機(jī)器學(xué)習(xí)來(lái)獲得更精確的癟胎檢測(cè)器。這是訓(xùn)練有關(guān)數(shù)據(jù)(很多很多很多來(lái)自扁平輪胎和非扁平輪胎的信號(hào)的例子),顯然,但是獲得這些數(shù)據(jù)并不難。這是一個(gè)特征,而不是護(hù)城河。
因此,我之前說(shuō)過(guò)ML啟動(dòng)有兩個(gè)問(wèn)題:如何獲取數(shù)據(jù)以及您需要多少?但這些只是技術(shù)問(wèn)題:你還會(huì)問(wèn)你如何進(jìn)入市場(chǎng),你的可尋址市場(chǎng)是什么,你解決的問(wèn)題對(duì)你的客戶(hù)有多大價(jià)值,等等。也就是說(shuō),很快就會(huì)有任何“AI”創(chuàng)業(yè)公司 - 他們將成為工業(yè)過(guò)程分析公司,法律平臺(tái)公司或銷(xiāo)售優(yōu)化公司。事實(shí)上,機(jī)器學(xué)習(xí)的傳播并不意味著谷歌變得更強(qiáng)大,但各種各樣的創(chuàng)業(yè)公司都可以比以前更快地用這種前沿科學(xué)建立事物。
這讓我想到了我在其他地方使用過(guò)的比喻 - 我們應(yīng)該將機(jī)器學(xué)習(xí)與SQL進(jìn)行比較。它是一個(gè)重要的構(gòu)建塊,允許新的和重要的事情,并將成為一切的一部分。如果你不使用它和你的競(jìng)爭(zhēng)對(duì)手,你會(huì)落后。有些人會(huì)用這種方式創(chuàng)建全新的公司 - 沃爾瑪成功的一部分來(lái)自于使用數(shù)據(jù)庫(kù)來(lái)更有效地管理庫(kù)存和物流。但是今天,如果你創(chuàng)辦了一家零售商并說(shuō)“......我們將要使用數(shù)據(jù)庫(kù)”,這不會(huì)讓你與眾不同或有趣 - SQL成為了一切的一部分然后消失了。機(jī)器學(xué)習(xí)也會(huì)發(fā)生同樣的情況。
本文為簡(jiǎn)譯,更多詳情請(qǐng)參見(jiàn)原文。
文章來(lái)源: 網(wǎng)易云社區(qū)
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/25402.html
摘要:近日,一篇在上成為了網(wǎng)友熱議的話(huà)題。在這種結(jié)構(gòu)改變幾個(gè)月后,微軟宣布注資億美元。與微軟的合作關(guān)系是基于一個(gè)重要的前提,即微軟有權(quán)將的部分技術(shù)商業(yè)化。網(wǎng)友紛紛稱(chēng)早已應(yīng)該更名為。 編譯?| 禾木木 出品 |?AI科技大本營(yíng)(ID:rgznai100) OpenAI 如何以 10 億美元的價(jià)...
摘要:我們來(lái)聊聊可能很快就會(huì)影響世界的九大創(chuàng)新人工智能能夠獨(dú)立于人類(lèi)主人而學(xué)習(xí)操作的人工智能,這看上去就像科幻小說(shuō)。以色列公司建立了世界最大的海水淡化工廠,每天能生產(chǎn)立方米淡水。 本文轉(zhuǎn)載自:眾成翻譯譯者:文藺鏈接:http://www.zcfy.cc/article/830原文:https://medium.com/startup-grind/9-innovations-that-coul...
摘要:而這種舉一反三的能力在機(jī)器學(xué)習(xí)領(lǐng)域同樣適用,科學(xué)家將其稱(chēng)之為遷移學(xué)習(xí)。與深度學(xué)習(xí)相比,我們技術(shù)較大優(yōu)點(diǎn)是具有可證明的性能保證。近幾年的人工智能熱潮中,深度學(xué)習(xí)是最主流的技術(shù),以及之后的成功,更是使其幾乎成為的代名詞。 如今,人類(lèi)將自己的未來(lái)放到了技術(shù)手里,無(wú)論是讓人工智能更像人類(lèi)思考的算法,還是讓機(jī)器人大腦運(yùn)轉(zhuǎn)更快的芯片,都在向奇點(diǎn)靠近。谷歌工程總監(jiān)、《奇點(diǎn)臨近》的作者庫(kù)茲韋爾認(rèn)為,一旦智能...
摘要:易于學(xué)習(xí),用戶(hù)友好且功能強(qiáng)大,所以能在編程語(yǔ)言中排名前五的毫不令人意外。感謝各種庫(kù)使得成為科學(xué)計(jì)算方面的很好的語(yǔ)言。金融科技企業(yè)需要一種易于處理,可擴(kuò)展,成熟,高性能的編程語(yǔ)言,并配有現(xiàn)成的庫(kù)和組件。 Quora問(wèn)題:Python作為一種編程語(yǔ)言有多強(qiáng)大?以下是Patrycja Okowicka的回答 說(shuō)實(shí)話(huà),Python是一門(mén)強(qiáng)大的語(yǔ)言,幾乎所有東西都可以用Python創(chuàng)建!這就是為...
摘要:今年月日收購(gòu)了基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)創(chuàng)業(yè)公司。這項(xiàng)基于深度學(xué)習(xí)的計(jì)算機(jī)視覺(jué)技術(shù)已經(jīng)開(kāi)發(fā)完成,正在測(cè)試。深度學(xué)習(xí)的誤區(qū)及產(chǎn)品化浪潮百度首席科學(xué)家表示目前圍繞存在著某種程度的夸大,它不單出現(xiàn)于媒體的字里行間,也存在于一些研究者之中。 在過(guò)去的三十年,深度學(xué)習(xí)運(yùn)動(dòng)一度被認(rèn)為是學(xué)術(shù)界的一個(gè)異類(lèi),但是現(xiàn)在, Geoff Hinton(如圖1)和他的深度學(xué)習(xí)同事,包括紐約大學(xué)Yann LeCun和蒙特...
閱讀 2303·2021-08-23 09:46
閱讀 944·2019-08-29 18:31
閱讀 1897·2019-08-29 17:04
閱讀 2488·2019-08-29 12:23
閱讀 1872·2019-08-26 14:05
閱讀 1105·2019-08-26 13:44
閱讀 3210·2019-08-26 12:23
閱讀 2227·2019-08-26 10:46