讀取excel中的資料:
命令:read.xlsx("base.xlsx", 1)
報錯:error in make.names(vnames, unique = true)
原因:中文不識別
處理方法:在最後加上encoding = 「utf-8」
data = read.xlsx(「1.xlsx」,1,encoding = 「utf-8」)
關於資料的缺失值:
#01-判斷是否缺失
> a<-c(1,1,na,1)
> is.na(a)
[1] false false true false
#02返回缺失值位置
> which(is.na(a))
[1] 3
#03計算資料集a的缺失值總數
> sum(is.na(a))
[1] 1
找出資料集中有缺失值的行,將其記錄到令乙個資料框中,將原資料框中有缺失值的行刪除:
list <-which(rowsums(is.na(rw_hafu))
> 0)
# hafu資料集中有缺失值的行。
hafu_na <- rw_hafu[list,]
#提取有缺失值的行。
hafu_a <- rw_hafu[-list,]
# 產生無缺失值的行。
檢視包內函式:
檢視base基礎包函式名:ls("package:base")
檢視base包的所有函式和源**:mget(ls("package:base"), inherits = true)
安裝函式包時出現的錯誤:無法在貯藏處
解決方法:出現這個問題的原因是自己的電腦(windows10)設定了**,首先一次找到win10中設定 --> **
然後將**介面中的選項全部取消勾選即可。
用R語言進行資料分析
用美國 台網公布的全球2013年5月20日22點到24點發生的所有 的震級資料實驗。mag mag 1 1.6 0.9 2.1 2.2 2.3 1.7 1.3 1.6 4.7 1.2 0.9 4.7 0.6 5.3 1.1 4.8 4.0 4.2 4.6 1.3 2.1 1.5 3.0 factor...
利用python進行資料分析
目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...
利用python進行資料分析
利用python進行資料分析,需要了解一些基本的方法,比如掌握回歸分析的方法,通過線性回歸和邏輯回歸,其實你就可以對大多數的資料進行回歸分析,並得出相對精確地結論。這部分需要掌握的知識點如下 回歸分析 線性回歸 邏輯回歸 基本的分類演算法 決策樹 隨機森林 樸素貝葉斯 基本的聚類演算法 k mean...