摘要:然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計(jì)功能。對(duì)于大多數(shù)專業(yè)人士而言,這是昂貴的且沒(méi)有能力以個(gè)人身份購(gòu)買。
介紹
我們熱衷于比較!
從智能手機(jī)中的三星,蘋果和HTC,移動(dòng)操作系統(tǒng)中的iOS,Android和Windows,到即將進(jìn)行選舉的候選人的比較,或?yàn)槭澜绫瓐F(tuán)隊(duì)選擇隊(duì)長(zhǎng),比較和討論豐富了我們的生活。如果你喜歡討論,你需要做的就是在一個(gè)充滿激情的論壇里拋出一個(gè)相關(guān)的問(wèn)題,然后看著它發(fā)酵。這個(gè)過(guò)程的美妙之處就在于,論壇里的每個(gè)人都是一個(gè)知識(shí)淵博的人。
那我在這里就拋出一個(gè)類似的話題—— SAS和R語(yǔ)言之爭(zhēng)可能是數(shù)據(jù)科學(xué)行業(yè)可能見(jiàn)證的最大爭(zhēng)辯,而Python是現(xiàn)在發(fā)展最快的語(yǔ)言之一,自成立以來(lái)已經(jīng)走過(guò)了漫長(zhǎng)的道路。我開(kāi)始討論這個(gè)話題不是想看它引爆全場(chǎng)(雖然這也很有趣),而是我知道我們都會(huì)從討論中受益。
這個(gè)問(wèn)題也經(jīng)常在博客中被人們討論。所以,我想和大家一起討論!
在這個(gè)問(wèn)題上討論的還不夠多嗎?可能是! 所以我還是覺(jué)得有必要進(jìn)行討論,理由如下:
數(shù)據(jù)科學(xué)非常有活力,前兩年進(jìn)行的討論可能與現(xiàn)在的情況沒(méi)什么關(guān)聯(lián)了。
傳統(tǒng)觀念里沒(méi)有把python列作比較之內(nèi),我覺(jué)得現(xiàn)在這是個(gè)非常值得深思的問(wèn)題。
雖然我們將討論有關(guān)語(yǔ)言的全球趨勢(shì),但我也將添加印度分析行業(yè)的相關(guān)具體信息(處于不同的發(fā)展水平)
好了,閑話少說(shuō),讓我們開(kāi)始討論吧!
背景下面是一些關(guān)于這三個(gè)生態(tài)系統(tǒng)的簡(jiǎn)要說(shuō)明:
SAS:SAS一直是商業(yè)分析領(lǐng)域無(wú)可爭(zhēng)議的市場(chǎng)領(lǐng)導(dǎo)者。該軟件提供大量統(tǒng)計(jì)功能,具有良好的GUI,供人們快速學(xué)習(xí),并提供強(qiáng)大的技術(shù)支持。然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計(jì)功能。
R:R是SAS的開(kāi)源對(duì)應(yīng)物,傳統(tǒng)上用于學(xué)術(shù)和研究。由于其開(kāi)源性質(zhì),最新技術(shù)可以快速發(fā)布?;ヂ?lián)網(wǎng)上有很多相關(guān)文檔,R是一個(gè)非常劃算的選擇。
Python:作為一種開(kāi)源腳本語(yǔ)言,Python的使用者數(shù)量隨著時(shí)間的推移而不斷增長(zhǎng)。今天,它集成一些庫(kù)(numpy,scipy和matplotlib)和幾乎所有你可能想做的統(tǒng)計(jì)操作/模型構(gòu)建的功能。自從引入pandas以來(lái),它在結(jié)構(gòu)化數(shù)據(jù)的操作方面變得非常強(qiáng)大。
屬性比較我將在以下屬性上比較這些語(yǔ)言:
1.可用性/成本
2.易于學(xué)習(xí)
3.數(shù)據(jù)處理能力
4.圖形功能
5.先進(jìn)的工具
6.工作場(chǎng)景
7.深度學(xué)習(xí)支持
8.客戶服務(wù)支持和社區(qū)
我從分析師的角度來(lái)比較這些。 因此,如果您正在為您的公司尋找要購(gòu)買的工具,您可能無(wú)法在此獲得完整的答案。但是以下信息仍然有用。 對(duì)于每個(gè)屬性,我給這三種語(yǔ)言中的每一種都給出一個(gè)分?jǐn)?shù)(1 - 低 ; 5 - 高)。
這些參數(shù)的權(quán)重,根據(jù)您的職業(yè)生涯階段和雄心而有所不同。
可用性/成本SAS是一款商業(yè)軟件。對(duì)于大多數(shù)專業(yè)人士而言,這是昂貴的且沒(méi)有能力以個(gè)人身份購(gòu)買。但是,它在私人企業(yè)中擁有最高的市場(chǎng)份額。 因此,除非您在投資了SAS的機(jī)構(gòu)中,否則可能很難接觸到SAS。 盡管如此,SAS已經(jīng)引入了一個(gè)可以免費(fèi)訪問(wèn)的大學(xué)版,但它有一些局限性。在那里你也是可以使用 Jupyter notebook的!
另一方面,R&Python是完全免費(fèi)的。以下是我對(duì)此參數(shù)的打分:
SAS - 3
R - 5
Python - 5
易于學(xué)習(xí)SAS易于學(xué)習(xí),并為已經(jīng)了解SQL的人提供簡(jiǎn)便的選項(xiàng)(PROC SQL)。 不僅如此,它在其存儲(chǔ)庫(kù)中具有良好的穩(wěn)定GUI界面。 在資源方面,各大學(xué)的網(wǎng)站上都有教程,SAS有全面的文檔。 從SAS培訓(xùn)機(jī)構(gòu)出來(lái)是可以獲得認(rèn)證的,但它們也是需要一筆花費(fèi)。
R在3種語(yǔ)言中具有最陡峭的學(xué)習(xí)曲線。它要求您學(xué)習(xí)和理解編碼。R是低級(jí)編程語(yǔ)言,因此簡(jiǎn)單的過(guò)程可能需要較長(zhǎng)的代碼。
Python因其編程世界的簡(jiǎn)單性而聞名。 對(duì)于數(shù)據(jù)分析也是如此。,雖然目前還沒(méi)有廣泛的GUI界面,但我希望Python notebooks會(huì)變得越來(lái)越主流。 它們?yōu)槲臋n和共享提供了出色的功能。
SAS - 4.5
R - 2.5
Python - 3.5
數(shù)據(jù)處理能力這一度是SAS的優(yōu)勢(shì)。 R計(jì)算內(nèi)存(RAM)中的每一個(gè)單元,因此計(jì)算受到32位機(jī)器上的RAM數(shù)量的限制。 但是現(xiàn)在已不再是這種情況。 這三種語(yǔ)言都具有良好的數(shù)據(jù)處理能力和并行計(jì)算選項(xiàng)。我覺(jué)得這不再是一個(gè)很大的區(qū)別。 他們都帶來(lái)了Hadoop和Spark集成,他們也支持Cloudera和Apache Pig。
SAS - 4
R - 4
Python - 4
圖形功能SAS具有不錯(cuò)的功能圖形功能。但是,它只是功能性的。對(duì)繪圖進(jìn)行任何自定義都很困難,需要您了解SAS Graph包的復(fù)雜性。R和Python具有非常先進(jìn)的圖形功能。 有許多軟件包可以為您提供高級(jí)圖形功能。隨著Plotly被引入兩種語(yǔ)言并且Python帶有Seaborn,制作自定義繪圖從未如此簡(jiǎn)單。
SAS - 3
R - 4.5
Python - 4.5
先進(jìn)的工具所有3個(gè)生態(tài)系統(tǒng)都具備所有基本和最需要的功能。 此功能僅在您處理最新技術(shù)和算法時(shí)才有意義。
由于其開(kāi)放性,R&Python可以快速獲得最新功能。 另一方面,SAS更新了其在新版本推出中的功能。 由于R在過(guò)去被廣泛用于學(xué)術(shù)界,因此新技術(shù)的發(fā)展很快。
話雖如此,SAS在受控環(huán)境中發(fā)布更新,因此它們經(jīng)過(guò)了充分測(cè)試。 另一方面,R&Python有開(kāi)放的貢獻(xiàn),并且在最新的發(fā)展中存在錯(cuò)誤的可能性。
SAS - 4
R - 4.5
Python - 4.5
工作場(chǎng)景在全球范圍內(nèi),SAS仍然是用于企業(yè)工作的市場(chǎng)領(lǐng)導(dǎo)者。大多數(shù)大公司仍在使用SAS。另一方面,R / Python是尋求成本效益的初創(chuàng)企業(yè)和公司的更好選擇。此外,據(jù)報(bào)道R / Python上的工作數(shù)量在過(guò)去幾年中有所增加。 這是一個(gè)在互聯(lián)網(wǎng)上廣泛發(fā)布的趨勢(shì),它顯示了R和SAS工作的趨勢(shì)。 用于數(shù)據(jù)分析的Python作業(yè)與R作業(yè)具有相似或更高的趨勢(shì):
下圖顯示了藍(lán)色的R和橙色的SAS:
這個(gè)圖表現(xiàn)了另一個(gè)方面,藍(lán)色的R與橙色的python:
總的來(lái)說(shuō),語(yǔ)言的市場(chǎng)可以用下圖表示:
SAS – 4
R – 4.5
Python – 4.5
客戶服務(wù)支持與社區(qū)R和Python擁有最大的在線社區(qū),但沒(méi)有客戶服務(wù)支持。 所以,如果你遇到麻煩,你就是靠自己。 你會(huì)得到很多幫助。另一方面,SAS提供專門的客戶服務(wù)與社區(qū)服務(wù)。 因此,如果您在安裝或任何其他技術(shù)挑戰(zhàn)方面遇到問(wèn)題,可以與他們聯(lián)系。
SAS – 4
R – 3.5
Python – 3.5
深度學(xué)習(xí)支持SAS的深度學(xué)習(xí)仍處于起步階段,有很多工作要做。
另一方面,Python在該領(lǐng)域取得了很大的進(jìn)步,并擁有許多軟件包,如Tensorflow和Keras。
R最近增加了對(duì)這些軟件包的支持,以及一些基礎(chǔ)的軟件包。 R中的kerasR和keras包充當(dāng)了原始Python包,Keras的接口。
SAS – 2
Python – 4.5
R – 3
其他因素以下是一些值得注意的問(wèn)題:
Python在Web開(kāi)發(fā)中被廣泛使用。 因此,如果您從事在線業(yè)務(wù),使用Python進(jìn)行Web開(kāi)發(fā)和分析可以提供協(xié)同效應(yīng)。
SAS過(guò)去在部署端到端基礎(chǔ)架構(gòu)(可視化分析,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)質(zhì)量,報(bào)告和分析)方面具有很大的優(yōu)勢(shì),這已經(jīng)通過(guò)在SAP HANA和Tableau等平臺(tái)上集成/支持R而得到緩解。 它仍然遠(yuǎn)離SAS之類的無(wú)縫集成,但旅程已經(jīng)開(kāi)始。
總結(jié)在今天的情景中,我們看到市場(chǎng)略微向Python傾斜??紤]到行業(yè)的動(dòng)態(tài)性,投資將會(huì)占據(jù)優(yōu)勢(shì)。根據(jù)您的情況(職業(yè)階段,財(cái)務(wù)等),您可以添加自己的權(quán)重,并提出可能適合您的權(quán)重。以下是一些具體方案:
如果您是進(jìn)入分析行業(yè)的新手(特別是在印度),我建議您學(xué)習(xí)SAS作為您的第一語(yǔ)言。它易于學(xué)習(xí),占有最高的就業(yè)市場(chǎng)份額。
如果你是一個(gè)已經(jīng)在工業(yè)上花時(shí)間的人,你應(yīng)該嘗試將你的專業(yè)知識(shí)多樣化,學(xué)習(xí)一種新工具。
對(duì)于行業(yè)的專家和專業(yè)人士,人們至少應(yīng)該知道其中的兩個(gè)。這將為未來(lái)增加很多靈活性并開(kāi)辟新的機(jī)會(huì)。
如果你是一個(gè)初創(chuàng)/自由職業(yè)者,R / Python更有用。
從戰(zhàn)略上講,需要更多實(shí)際操作幫助和培訓(xùn)的企業(yè)設(shè)置選擇SAS作為選項(xiàng)。
研究人員和統(tǒng)計(jì)學(xué)家選擇R作為替代方案,因?yàn)樗兄诜敝氐挠?jì)算。正如他們所說(shuō),R的目的是完成工作而不是簡(jiǎn)化您的計(jì)算機(jī)。
由于其輕量級(jí)特性和不斷發(fā)展的社區(qū),Python已成為當(dāng)今初創(chuàng)公司的明顯選擇。它也是深度學(xué)習(xí)的最佳選擇。
這是最終的得分表:
文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/44027.html
摘要:為了你最好的未來(lái),請(qǐng)不斷的學(xué)習(xí)創(chuàng)始人兼首席執(zhí)行官人工智能和機(jī)器學(xué)習(xí)的時(shí)代已經(jīng)到來(lái)了,這些領(lǐng)域都有可能對(duì)印度的行業(yè)產(chǎn)生重大的影響。在印度努力重振生產(chǎn)力增長(zhǎng)的同時(shí),人工智能和機(jī)器學(xué)習(xí)有望填補(bǔ)這一空白。 showImg(http://upload-images.jianshu.io/upload_images/13825820-702c6873cd07cfc3.jpg?imageMogr2/...
摘要:概述在真實(shí)的數(shù)據(jù)科學(xué)世界里,我們會(huì)有兩個(gè)極端,一個(gè)是業(yè)務(wù),一個(gè)是工程。偏向業(yè)務(wù)的數(shù)據(jù)科學(xué)被稱為數(shù)據(jù)分析,也就是型數(shù)據(jù)科學(xué)。所以說(shuō),同時(shí)學(xué)會(huì)和這兩把刷子才是數(shù)據(jù)科學(xué)的王道。 showImg(https://segmentfault.com/img/bVAgki?w=980&h=596); 概述 在真實(shí)的數(shù)據(jù)科學(xué)世界里,我們會(huì)有兩個(gè)極端,一個(gè)是業(yè)務(wù),一個(gè)是工程。偏向業(yè)務(wù)的數(shù)據(jù)科學(xué)被稱為數(shù)據(jù)...
閱讀 1368·2021-11-24 09:39
閱讀 1358·2021-11-04 16:12
閱讀 2701·2021-09-24 09:47
閱讀 3346·2021-09-01 10:50
閱讀 1487·2019-08-30 15:55
閱讀 1432·2019-08-30 15:43
閱讀 652·2019-08-30 11:08
閱讀 3588·2019-08-23 18:33