【cut 命令】
格式:cut [選項] file
選項:-b :以位元組為單位進行分割。這些位元組位置將忽略多位元組字元邊界,除非也指定了 -n 標誌。
-c :以字元為單位進行分割。
-d :自定義分隔符,預設為製表符。
-f :與-d一起使用,指定顯示哪個區域(fields)。
-n :取消分割多位元組字元。僅和 -b 標誌一起使用。如果字元的最後乙個位元組落在由 -b 標誌的 list 引數指示的
範圍之內,該字元將被寫出;否則,該字元將被排除。
具體例子:
【awk 命令】
格式:awk [選項] '條件' filenames
選項:-f
:指定分隔符
$n: $0指當前行,$1~$n
指第幾列
具體例子:
【sort 命令】
格式:sort [選項][原始檔][-o 輸出到檔案]
選項:-b 忽略每行前面開始出的空格字元。
-c 檢查檔案是否已經按照順序排序。
-f 排序時,忽略大小寫字母。
-m 將前面3個字母依照月份的縮寫進行排序。
-n 依照數值的大小排序。
-o《輸出檔案》 將排序後的結果存入指定的檔案。
-r 以相反的順序來排序。
-t《分隔字元》 指定排序時所用的字段分隔字元。
-k 選擇以哪個區間進行排序。
具體例子:
總結:注意上面三個命令定義分隔符選項:
cut命令是以-d選項來指定分隔符,預設為製表符;-f指定顯示哪個區域或哪列
awk命令是以-f選項來指定分隔符,預設為製表符;$1~$n指定第幾列
sort命令是以-t選項來指定分隔符,預設為製表符;-k指定哪個區間或哪列
理解cut,awk,sort三個命令的分隔符選項
cut 命令 格式 cut 選項 file 選項 b 以位元組為單位進行分割。這些位元組位置將忽略多位元組字元邊界,除非也指定了 n 標誌。c 以字元為單位進行分割。d 自定義分隔符,預設為製表符。f 與 d一起使用,指定顯示哪個區域 fields n 取消分割多位元組字元。僅和 b 標誌一起使用。...
理解SOA概念的三個比喻
從我第一次聽說soa到現在有幾年的時間了,其間和各種各樣的人士有了各式各樣的討論,越來越發覺這不是個可以用定義來說得明白的概念,以前軟體行業裡還沒有個詞容易引起如此多的非議與爭論,我有時覺得soa很想禪宗裡講的,說是一物即不中 其中最難的,就是把這樣乙個抽象的概念說給沒有技術背景的人去聽,建立概念唯...
大資料三個特點的理解
寫這篇文章始於對維克托前輩 大資料時代 的理解與思考,大資料的浪潮已經一波一波地拍打在中國的土地上,各行各業都在積極的探索與這一技術的接軌和發展的機遇,所以能夠見證並親歷這乙個變革技術的時代我們這一代是幸運的。之所以說大資料時代是一次變革,不光是其技術進步所帶來的,其伴隨的思維衝擊與變革也是前所未有...