author:秦景坤
date:2017-07-02
github:
乙個資料矩陣一行是一次觀測,一列是乙個變數
分類問題(qualitative)-取值空間有限,不能進行運算
變數間的關係(對應不同的視覺化方法和統計分析方法)
example:
1 9 2 8 3 9 4 5 7 6
均值 = (1+9+2+8+3+9+4+5+7+6)/10 = 5.4
中位數 = 排序後位於正中間的乙個數 或 位於正中間的兩個數的均值 = 5.5
眾數 = 出現次數最多的數 = 9
穩健統計量(robust statistics)
乙個變數的視覺化
-柱狀圖(histogram)、點圖(dot plot)(分布)
-箱圖( box plot)(中位數、分位點、極端值)
豎著放的兩個變數的關係
分類變數是不可以進行數**算的,所以不像數值變數有平均值等的概念。
乙個分類變數、乙個數值變數的關係
-併排箱圖(side-by-side box plot)
大資料基礎 R語言
目錄 1.r語言是解釋性語言還是編譯性語言?2.簡述r語言的基本功能。3.r語言通常用在哪些領域?4.r語言常用的分類和 演算法有哪些?5.簡述如何利用r程式包進行資料分析 建模和資料 6.如何使用 聚類 和 分類 對資料樣本進行分組。7.sparkr dataframe的作用有哪些?8.簡述spa...
R語言基礎
一 幫助 學習r,要遵循r的法則。在r的王國裡,遇到不會的問題,第一不是問度娘,而是r為你提供的指 難 針。1.help.start 開啟幫助文件首頁。大而全,一般你不會去看的,除非你很無聊,想看看被如此多人熱愛的r,究竟有幾條胳膊幾條腿。2.help plot 或?plot 開啟函式的幫助 3.h...
R語言基礎
博主目前business analytics 在讀,求職方向資料科學家。閒著的時候把r的知識整理總結,也希望自己在逐漸高階的過程中把知識分享給想要進入資料科學行業的朋友們。會慢慢豐富起來噠 x 3 y 5 x y 是賦值符號 給r語句標註的符號是 r會自動掠過前面有 的語句。c vec 1 c 1,...