python與R 對比SAS ,我該選擇哪種工具?

2021-09-27 10:59:28 字數 3694 閱讀 8934

我們熱衷於比較!

從智慧型手機中的三星,蘋果和htc,移動作業系統中的ios,android和windows,到即將進行選舉的候選人的比較,或為世界盃團隊選擇隊長,比較和討論豐富了我們的生活。如果你喜歡討論,你需要做的就是在乙個充滿激情的論壇裡丟擲乙個相關的問題,然後看著它發酵。這個過程的美妙之處就在於,論壇裡的每個人都是乙個知識淵博的人。

那我在這裡就丟擲乙個類似的話題—— sas和r語言之爭可能是資料科學行業可能見證的最大爭辯,而python是現在發展最快的語言之一,自成立以來已經走過了漫長的道路。我開始討論這個話題不是想看它引爆全場(雖然這也很有趣),而是我知道我們都會從討論中受益。

這個問題也經常在部落格中被人們討論。所以,我想和大家一起討論!

可能是! 所以我還是覺得有必要進行討論,理由如下:

好了,閒話少說,讓我們開始討論吧!

下面是一些關於這三個生態系統的簡要說明:

我將在以下屬性上比較這些語言:

1.可用性/成本

2.易於學習

3.資料處理能力

4.圖形功能

5.先進的工具

6.工作場景

7.深度學習支援

8.客戶服務支援和社群

我從分析師的角度來比較這些。 因此,如果您正在為您的公司尋找要購買的工具,您可能無法在此獲得完整的答案。但是以下資訊仍然有用。 對於每個屬性,我給這三種語言中的每一種都給出乙個分數(1 - 低 ; 5 - 高)。

這些引數的權重,根據您的職業生涯階段和雄心而有所不同。

sas是一款商業軟體。對於大多數專業人士而言,這是昂貴的且沒有能力以個人身份購買。但是,它在私人企業中擁有最高的市場份額。 因此,除非您在投資了sas的機構中,否則可能很難接觸到sas。 儘管如此,sas已經引入了乙個可以免費訪問的大學版,但它有一些侷限性。在那裡你也是可以使用 jupyter notebook的!

另一方面,r&python是完全免費的。以下是我對此引數的打分:

sas - 3

r - 5

python - 5

sas易於學習,並為已經了解sql的人提供簡便的選項(proc sql)。 不僅如此,它在其儲存庫中具有良好的穩定gui介面。 在資源方面,各大學的**上都有教程,sas有全面的文件。 從sas培訓機構出來是可以獲得認證的,但它們也是需要一筆花費。

r在3種語言中具有最陡峭的學習曲線。它要求您學習和理解編碼。r是低階程式語言,因此簡單的過程可能需要較長的**。

python因其程式設計世界的簡單性而聞名。 對於資料分析也是如此。,雖然目前還沒有廣泛的gui介面,但我希望python notebooks會變得越來越主流。 它們為文件和共享提供了出色的功能。

這一度是sas的優勢。 r計算記憶體(ram)中的每乙個單元,因此計算受到32位機器上的ram數量的限制。 但是現在已不再是這種情況。 這三種語言都具有良好的資料處理能力和平行計算選項。我覺得這不再是乙個很大的區別。 他們都帶來了hadoop和spark整合,他們也支援cloudera和apache pig。

sas - 4

r - 4

python - 4

sas具有不錯的功能圖形功能。但是,它只是功能性的。對繪圖進行任何自定義都很困難,需要您了解sas graph包的複雜性。r和python具有非常先進的圖形功能。 有許多軟體包可以為您提供高階圖形功能。隨著plotly被引入兩種語言並且python帶有seaborn,製作自定義繪圖從未如此簡單。

sas - 3

r - 4.5

python - 4.5

所有3個生態系統都具備所有基本和最需要的功能。 此功能僅在您處理最新技術和演算法時才有意義。

由於其開放性,r&python可以快速獲得最新功能。 另一方面,sas更新了其在新版本推出中的功能。 由於r在過去被廣泛用於學術界,因此新技術的發展很快。

話雖如此,sas在受控環境中發布更新,因此它們經過了充分測試。 另一方面,r&python有開放的貢獻,並且在最新的發展中存在錯誤的可能性。

sas - 4

r - 4.5

python - 4.5

在全球範圍內,sas仍然是用於企業工作的市場領導者。大多數大公司仍在使用sas。另一方面,r / python是尋求成本效益的初創企業和公司的更好選擇。此外,據報道r / python上的工作數量在過去幾年中有所增加。 這是乙個在網際網路上廣泛發布的趨勢,它顯示了r和sas工作的趨勢。 用於資料分析的python作業與r作業具有相似或更高的趨勢:

下圖顯示了藍色的r和橙色的sas:

這個圖表現了另乙個方面,藍色的r與橙色的python:

總的來說,語言的市場可以用下圖表示:

sas的深度學習仍處於起步階段,有很多任務作要做。

另一方面,python在該領域取得了很大的進步,並擁有許多軟體包,如tensorflow和keras。

r最近增加了對這些軟體包的支援,以及一些基礎的軟體包。 r中的kerasr和keras包充當了原始python包,keras的介面。

sas – 2

python – 4.5

r – 3

以下是一些值得注意的問題:

sas過去在部署端到端基礎架構(視覺化分析,資料倉儲,資料質量,報告和分析)方面具有很大的優勢,這已經通過在sap hana和tableau等平台上整合/支援r而得到緩解。 它仍然遠離sas之類的無縫整合,但旅程已經開始。

在今天的情景中,我們看到市場略微向python傾斜。考慮到行業的動態性,投資將會佔據優勢。根據您的情況(職業階段,財務等),您可以新增自己的權重,並提出可能適合您的權重。以下是一些具體方案:

從戰略上講,需要更多實際操作幫助和培訓的企業設定選擇sas作為選項。

研究人員和統計學家選擇r作為替代方案,因為它有助於繁重的計算。正如他們所說,r的目的是完成工作而不是簡化您的計算機。

由於其輕量級特性和不斷發展的社群,python已成為當今初創公司的明顯選擇。它也是深度學習的最佳選擇。

這是最終的得分表:

r與python互動 讓R與Python共舞

r 又稱r語言 是一款開源的跨平台的數值統計和數值圖形化展現 工具。通俗點說,r是用來做統計和畫圖的。r擁有自己的指令碼語言和大量的統計 圖形庫 得益於開源社群 這讓她看起來既美又實用。與其他同類軟體 如 spss 相比,r的特點是純命令列的,這倒也好,我們更應該把注意力放在資料本身,而非統計工具的...

python與c 的對比

一位正在學校做課程設計題目,要求在乙個檔案中找到給定單詞出現的位置並統計出現次數。這是乙個比較簡單的文字處理問題,於是,我給他用 python 寫了乙個,並打賭在5分鐘內用不到30行程式解決問題。我作到了,下面是程式 if name main file name raw input input th...

R和python資料分析方面的對比爭論

面對大量的資料進行分析時,選擇一款好的工具或者方法至關重要,節約時間的同時,還能讓資料結構清晰明了,在最近幾年,用r,python的人越來越多,於是出現了眾多關於用哪個做資料分析最好的爭議。在這裡分享一下關於r和python資料分析方面的觀點 首先,從整體來說,認為資料分析需要的是在有限時間內,用最...