> x <- data.frame(v1=1:5,v2=6:10,v3=11:15)
> x
v1 v2 v3
1 1 6 11
2 2 7 12
3 3 8 13
4 4 9 14
5 5 10 15
> x$v3[c(2,4)] <- na
> x
v1 v2 v3
1 1 6 11
2 2 7 na
3 3 8 13
4 4 9 na
5 5 10 15
> #找出第2列
> x[,2]
[1] 6 7 8 9 10
> x[,"v2"]
[1] 6 7 8 9 10
> x[( x$v1<4&x$v2>= 8),] #找出第1列小於4並且第2列大於等於8的元素
v1 v2 v3
3 3 8 13
> x[x$v1>2,] #第1列大於2的所有元素
v1 v2 v3
3 3 8 13
4 4 9 na
5 5 10 15
> x[which(x$v1>2),] #使用which函式篩選第1列大於2的所有元素
v1 v2 v3
3 3 8 13
4 4 9 na
5 5 10 15
> ?which
> which(x$v1>2)
[1] 3 4 5
> x$v1>2
[1] false false true true true
> subset(x,x$v1>2) #和上面的操作一樣,篩選第1列大於2的所有元素
v1 v2 v3
3 3 8 13
4 4 9 na
5 5 10 15
pandas 資料子集的獲取
有時資料讀入後並不是對整體資料進行分析,而是資料中的部分子集,例如,對於地鐵乘客量可能只關心某些時間段的流量,對於商品的交易可能只需要分析某些顏色的 變動,對於醫療診斷資料可能只對某個年齡段的人群感興趣等。所以,該如何根據特定的條件實現資料子集的獲取將是本節的主要內容。通常,在pandas模組中實現...
匯入表資料子集
匯入表資料子集 我們可以匯入表的使用sqoop匯入工具,where 子句的乙個子集。它執行在各自的資料庫伺服器相應的 sql查詢,並將結果儲存在 hdfs 的目標目錄。where子句的語法如下。where 下面的命令用來匯入emp add表資料的子集。子集查詢檢索員工 idsecunderabad ...
3 3 可變資料的模型
3.3 可變資料的模型 第二章中提到了復合資料作為組裝有幾個部分的 計算物件的一種方法,為了實現對真實世界中,有 幾個部分的物件進行模擬 在那一章中,我們介紹了資料抽象的原則,根據術語,資料結構被稱為組裝子 用來建立資料物件 選擇子 用來訪問復合的資料物件的每乙個部分 但是現在我們 知道資料有乙個在...