成人国产在线小视频_日韩寡妇人妻调教在线播放_色成人www永久在线观看_2018国产精品久久_亚洲欧美高清在线30p_亚洲少妇综合一区_黄色在线播放国产_亚洲另类技巧小说校园_国产主播xx日韩_a级毛片在线免费

資訊專欄INFORMATION COLUMN

python與R(對(duì)比SAS),我該選擇哪種工具?

BDEEFE / 1210人閱讀

摘要:然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計(jì)功能。對(duì)于大多數(shù)專業(yè)人士而言,這是昂貴的且沒(méi)有能力以個(gè)人身份購(gòu)買。

介紹

我們熱衷于比較!

從智能手機(jī)中的三星,蘋果和HTC,移動(dòng)操作系統(tǒng)中的iOS,Android和Windows,到即將進(jìn)行選舉的候選人的比較,或?yàn)槭澜绫瓐F(tuán)隊(duì)選擇隊(duì)長(zhǎng),比較和討論豐富了我們的生活。如果你喜歡討論,你需要做的就是在一個(gè)充滿激情的論壇里拋出一個(gè)相關(guān)的問(wèn)題,然后看著它發(fā)酵。這個(gè)過(guò)程的美妙之處就在于,論壇里的每個(gè)人都是一個(gè)知識(shí)淵博的人。

那我在這里就拋出一個(gè)類似的話題—— SAS和R語(yǔ)言之爭(zhēng)可能是數(shù)據(jù)科學(xué)行業(yè)可能見(jiàn)證的最大爭(zhēng)辯,而Python是現(xiàn)在發(fā)展最快的語(yǔ)言之一,自成立以來(lái)已經(jīng)走過(guò)了漫長(zhǎng)的道路。我開(kāi)始討論這個(gè)話題不是想看它引爆全場(chǎng)(雖然這也很有趣),而是我知道我們都會(huì)從討論中受益。

這個(gè)問(wèn)題也經(jīng)常在博客中被人們討論。所以,我想和大家一起討論!

在這個(gè)問(wèn)題上討論的還不夠多嗎?

可能是! 所以我還是覺(jué)得有必要進(jìn)行討論,理由如下:

數(shù)據(jù)科學(xué)非常有活力,前兩年進(jìn)行的討論可能與現(xiàn)在的情況沒(méi)什么關(guān)聯(lián)了。

傳統(tǒng)觀念里沒(méi)有把python列作比較之內(nèi),我覺(jué)得現(xiàn)在這是個(gè)非常值得深思的問(wèn)題。

雖然我們將討論有關(guān)語(yǔ)言的全球趨勢(shì),但我也將添加印度分析行業(yè)的相關(guān)具體信息(處于不同的發(fā)展水平)

好了,閑話少說(shuō),讓我們開(kāi)始討論吧!

背景

下面是一些關(guān)于這三個(gè)生態(tài)系統(tǒng)的簡(jiǎn)要說(shuō)明:

SAS:SAS一直是商業(yè)分析領(lǐng)域無(wú)可爭(zhēng)議的市場(chǎng)領(lǐng)導(dǎo)者。該軟件提供大量統(tǒng)計(jì)功能,具有良好的GUI,供人們快速學(xué)習(xí),并提供強(qiáng)大的技術(shù)支持。然而,它最終變成了一種昂貴的選擇,并不總是具有最新的統(tǒng)計(jì)功能。

R:R是SAS的開(kāi)源對(duì)應(yīng)物,傳統(tǒng)上用于學(xué)術(shù)和研究。由于其開(kāi)源性質(zhì),最新技術(shù)可以快速發(fā)布?;ヂ?lián)網(wǎng)上有很多相關(guān)文檔,R是一個(gè)非常劃算的選擇。

Python:作為一種開(kāi)源腳本語(yǔ)言,Python的使用者數(shù)量隨著時(shí)間的推移而不斷增長(zhǎng)。今天,它集成一些庫(kù)(numpy,scipy和matplotlib)和幾乎所有你可能想做的統(tǒng)計(jì)操作/模型構(gòu)建的功能。自從引入pandas以來(lái),它在結(jié)構(gòu)化數(shù)據(jù)的操作方面變得非常強(qiáng)大。

屬性比較

我將在以下屬性上比較這些語(yǔ)言:

1.可用性/成本

2.易于學(xué)習(xí)

3.數(shù)據(jù)處理能力

4.圖形功能

5.先進(jìn)的工具

6.工作場(chǎng)景

7.深度學(xué)習(xí)支持

8.客戶服務(wù)支持和社區(qū)

我從分析師的角度來(lái)比較這些。 因此,如果您正在為您的公司尋找要購(gòu)買的工具,您可能無(wú)法在此獲得完整的答案。但是以下信息仍然有用。 對(duì)于每個(gè)屬性,我給這三種語(yǔ)言中的每一種都給出一個(gè)分?jǐn)?shù)(1 - 低 ; 5 - 高)。

這些參數(shù)的權(quán)重,根據(jù)您的職業(yè)生涯階段和雄心而有所不同。

可用性/成本

SAS是一款商業(yè)軟件。對(duì)于大多數(shù)專業(yè)人士而言,這是昂貴的且沒(méi)有能力以個(gè)人身份購(gòu)買。但是,它在私人企業(yè)中擁有最高的市場(chǎng)份額。 因此,除非您在投資了SAS的機(jī)構(gòu)中,否則可能很難接觸到SAS。 盡管如此,SAS已經(jīng)引入了一個(gè)可以免費(fèi)訪問(wèn)的大學(xué)版,但它有一些局限性。在那里你也是可以使用 Jupyter notebook的!

另一方面,R&Python是完全免費(fèi)的。以下是我對(duì)此參數(shù)的打分:

SAS - 3

R - 5

Python - 5

易于學(xué)習(xí)

SAS易于學(xué)習(xí),并為已經(jīng)了解SQL的人提供簡(jiǎn)便的選項(xiàng)(PROC SQL)。 不僅如此,它在其存儲(chǔ)庫(kù)中具有良好的穩(wěn)定GUI界面。 在資源方面,各大學(xué)的網(wǎng)站上都有教程,SAS有全面的文檔。 從SAS培訓(xùn)機(jī)構(gòu)出來(lái)是可以獲得認(rèn)證的,但它們也是需要一筆花費(fèi)。

R在3種語(yǔ)言中具有最陡峭的學(xué)習(xí)曲線。它要求您學(xué)習(xí)和理解編碼。R是低級(jí)編程語(yǔ)言,因此簡(jiǎn)單的過(guò)程可能需要較長(zhǎng)的代碼。

Python因其編程世界的簡(jiǎn)單性而聞名。 對(duì)于數(shù)據(jù)分析也是如此。,雖然目前還沒(méi)有廣泛的GUI界面,但我希望Python notebooks會(huì)變得越來(lái)越主流。 它們?yōu)槲臋n和共享提供了出色的功能。

SAS - 4.5

R - 2.5

Python - 3.5

數(shù)據(jù)處理能力

這一度是SAS的優(yōu)勢(shì)。 R計(jì)算內(nèi)存(RAM)中的每一個(gè)單元,因此計(jì)算受到32位機(jī)器上的RAM數(shù)量的限制。 但是現(xiàn)在已不再是這種情況。 這三種語(yǔ)言都具有良好的數(shù)據(jù)處理能力和并行計(jì)算選項(xiàng)。我覺(jué)得這不再是一個(gè)很大的區(qū)別。 他們都帶來(lái)了Hadoop和Spark集成,他們也支持Cloudera和Apache Pig。

SAS - 4

R - 4

Python - 4

圖形功能

SAS具有不錯(cuò)的功能圖形功能。但是,它只是功能性的。對(duì)繪圖進(jìn)行任何自定義都很困難,需要您了解SAS Graph包的復(fù)雜性。R和Python具有非常先進(jìn)的圖形功能。 有許多軟件包可以為您提供高級(jí)圖形功能。隨著Plotly被引入兩種語(yǔ)言并且Python帶有Seaborn,制作自定義繪圖從未如此簡(jiǎn)單。

SAS - 3

R - 4.5

Python - 4.5

先進(jìn)的工具

所有3個(gè)生態(tài)系統(tǒng)都具備所有基本和最需要的功能。 此功能僅在您處理最新技術(shù)和算法時(shí)才有意義。

由于其開(kāi)放性,R&Python可以快速獲得最新功能。 另一方面,SAS更新了其在新版本推出中的功能。 由于R在過(guò)去被廣泛用于學(xué)術(shù)界,因此新技術(shù)的發(fā)展很快。

話雖如此,SAS在受控環(huán)境中發(fā)布更新,因此它們經(jīng)過(guò)了充分測(cè)試。 另一方面,R&Python有開(kāi)放的貢獻(xiàn),并且在最新的發(fā)展中存在錯(cuò)誤的可能性。

SAS - 4

R - 4.5

Python - 4.5

工作場(chǎng)景

在全球范圍內(nèi),SAS仍然是用于企業(yè)工作的市場(chǎng)領(lǐng)導(dǎo)者。大多數(shù)大公司仍在使用SAS。另一方面,R / Python是尋求成本效益的初創(chuàng)企業(yè)和公司的更好選擇。此外,據(jù)報(bào)道R / Python上的工作數(shù)量在過(guò)去幾年中有所增加。 這是一個(gè)在互聯(lián)網(wǎng)上廣泛發(fā)布的趨勢(shì),它顯示了R和SAS工作的趨勢(shì)。 用于數(shù)據(jù)分析的Python作業(yè)與R作業(yè)具有相似或更高的趨勢(shì):

下圖顯示了藍(lán)色的R和橙色的SAS:


這個(gè)圖表現(xiàn)了另一個(gè)方面,藍(lán)色的R與橙色的python:


總的來(lái)說(shuō),語(yǔ)言的市場(chǎng)可以用下圖表示:

SAS – 4

R – 4.5

Python – 4.5

客戶服務(wù)支持與社區(qū)

R和Python擁有最大的在線社區(qū),但沒(méi)有客戶服務(wù)支持。 所以,如果你遇到麻煩,你就是靠自己。 你會(huì)得到很多幫助。另一方面,SAS提供專門的客戶服務(wù)與社區(qū)服務(wù)。 因此,如果您在安裝或任何其他技術(shù)挑戰(zhàn)方面遇到問(wèn)題,可以與他們聯(lián)系。

SAS – 4

R – 3.5

Python – 3.5

深度學(xué)習(xí)支持

SAS的深度學(xué)習(xí)仍處于起步階段,有很多工作要做。

另一方面,Python在該領(lǐng)域取得了很大的進(jìn)步,并擁有許多軟件包,如Tensorflow和Keras。

R最近增加了對(duì)這些軟件包的支持,以及一些基礎(chǔ)的軟件包。 R中的kerasR和keras包充當(dāng)了原始Python包,Keras的接口。

SAS – 2

Python – 4.5

R – 3

其他因素

以下是一些值得注意的問(wèn)題:

Python在Web開(kāi)發(fā)中被廣泛使用。 因此,如果您從事在線業(yè)務(wù),使用Python進(jìn)行Web開(kāi)發(fā)和分析可以提供協(xié)同效應(yīng)。

SAS過(guò)去在部署端到端基礎(chǔ)架構(gòu)(可視化分析,數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)質(zhì)量,報(bào)告和分析)方面具有很大的優(yōu)勢(shì),這已經(jīng)通過(guò)在SAP HANA和Tableau等平臺(tái)上集成/支持R而得到緩解。 它仍然遠(yuǎn)離SAS之類的無(wú)縫集成,但旅程已經(jīng)開(kāi)始。

總結(jié)

在今天的情景中,我們看到市場(chǎng)略微向Python傾斜??紤]到行業(yè)的動(dòng)態(tài)性,投資將會(huì)占據(jù)優(yōu)勢(shì)。根據(jù)您的情況(職業(yè)階段,財(cái)務(wù)等),您可以添加自己的權(quán)重,并提出可能適合您的權(quán)重。以下是一些具體方案:

如果您是進(jìn)入分析行業(yè)的新手(特別是在印度),我建議您學(xué)習(xí)SAS作為您的第一語(yǔ)言。它易于學(xué)習(xí),占有最高的就業(yè)市場(chǎng)份額。

如果你是一個(gè)已經(jīng)在工業(yè)上花時(shí)間的人,你應(yīng)該嘗試將你的專業(yè)知識(shí)多樣化,學(xué)習(xí)一種新工具。

對(duì)于行業(yè)的專家和專業(yè)人士,人們至少應(yīng)該知道其中的兩個(gè)。這將為未來(lái)增加很多靈活性并開(kāi)辟新的機(jī)會(huì)。

如果你是一個(gè)初創(chuàng)/自由職業(yè)者,R / Python更有用。

從戰(zhàn)略上講,需要更多實(shí)際操作幫助和培訓(xùn)的企業(yè)設(shè)置選擇SAS作為選項(xiàng)。

研究人員和統(tǒng)計(jì)學(xué)家選擇R作為替代方案,因?yàn)樗兄诜敝氐挠?jì)算。正如他們所說(shuō),R的目的是完成工作而不是簡(jiǎn)化您的計(jì)算機(jī)。

由于其輕量級(jí)特性和不斷發(fā)展的社區(qū),Python已成為當(dāng)今初創(chuàng)公司的明顯選擇。它也是深度學(xué)習(xí)的最佳選擇。

這是最終的得分表:

文章版權(quán)歸作者所有,未經(jīng)允許請(qǐng)勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。

轉(zhuǎn)載請(qǐng)注明本文地址:http://systransis.cn/yun/44027.html

相關(guān)文章

  • 一份關(guān)于人工智能、機(jī)器學(xué)習(xí)和大數(shù)據(jù)的報(bào)告

    摘要:為了你最好的未來(lái),請(qǐng)不斷的學(xué)習(xí)創(chuàng)始人兼首席執(zhí)行官人工智能和機(jī)器學(xué)習(xí)的時(shí)代已經(jīng)到來(lái)了,這些領(lǐng)域都有可能對(duì)印度的行業(yè)產(chǎn)生重大的影響。在印度努力重振生產(chǎn)力增長(zhǎng)的同時(shí),人工智能和機(jī)器學(xué)習(xí)有望填補(bǔ)這一空白。 showImg(http://upload-images.jianshu.io/upload_images/13825820-702c6873cd07cfc3.jpg?imageMogr2/...

    Carbs 評(píng)論0 收藏0
  • [原]深入對(duì)比數(shù)據(jù)科學(xué)工具箱:PythonR之爭(zhēng)[2016版]

    摘要:概述在真實(shí)的數(shù)據(jù)科學(xué)世界里,我們會(huì)有兩個(gè)極端,一個(gè)是業(yè)務(wù),一個(gè)是工程。偏向業(yè)務(wù)的數(shù)據(jù)科學(xué)被稱為數(shù)據(jù)分析,也就是型數(shù)據(jù)科學(xué)。所以說(shuō),同時(shí)學(xué)會(huì)和這兩把刷子才是數(shù)據(jù)科學(xué)的王道。 showImg(https://segmentfault.com/img/bVAgki?w=980&h=596); 概述 在真實(shí)的數(shù)據(jù)科學(xué)世界里,我們會(huì)有兩個(gè)極端,一個(gè)是業(yè)務(wù),一個(gè)是工程。偏向業(yè)務(wù)的數(shù)據(jù)科學(xué)被稱為數(shù)據(jù)...

    whidy 評(píng)論0 收藏0

發(fā)表評(píng)論

0條評(píng)論

最新活動(dòng)
閱讀需要支付1元查看
<