sort,uniq,tr以及正規表示式

2021-10-21 23:44:02 字數 2979 閱讀 7585

以行為單位對檔案內容進行排序,也可以根據不同的資料型別來排序。

語法格式

sort [選項] 引數

cat file | sort 選項

常用選項-f

忽略大小寫,缺省會將大寫字母排在前面

-b忽略每行前面的空格

-n按照數字進行排序

-r反向排序

-u等同於uniq,表示相同的資料僅存在一行

-t指定字段分隔符,預設使用[tab]鍵分割

-k使用排序字段

-o 《輸出檔案》

將排序後的結果轉存至指定檔案

用於報告或者忽略檔案中連續的重複行,常與sort命令結合使用。

語法格式

uniq [選項] 引數

cat file | uniq 選項

常用選項-c

進行計數,並刪除檔案中重複出現的行

-d僅顯示連續的重複行

-u僅顯示出現一次的行

常用來對來自標準輸入的字元進行替換、壓縮和刪除

語法格式

tr [選項] [引數]

常用引數-c

保留字符集1的字元,其他字元(包括換行符\n)用字符集2替換

-d刪除所有屬於字符集1的字元

-s將重複出現的字串壓縮為乙個字串;可用字符集2替換字符集1

-t字符集2替換字符集1,不加選項同結果

引數

字符集1:指定要轉換或刪除的原字符集。當執行轉換操作時,必須使用引數「字符集2」指定轉換的目標字符集。但執行刪除操作時,不需要引數「字符集2」。

字符集2:指定要轉換成的目標字符集。

刪除windows檔案造成的"^m"字元:

cat abc.txt | tr -s "\r" "\n\" > new_file

或cat abc.txt | tr -d "\r"

> new_file

或dos2unix abc.txt

linux中遇到的換行符("\n")會進行回車+換行的操作,回車符反而只會作為控制字元("^m")顯示,不發生回車的操作。而windows中要回車符+換行符("\r\n")才會回車+換行,缺少乙個控制符或者順序不對都不能正確的另起一行。

顯示行中的指定部分,刪除檔案中的指定字段。

語法格式

cut 選項 引數

cut file | cut 選項

常用選項-f

通過指定哪乙個字段進行提取。cut命令使用「tab」作為預設的字元分隔符

-d「tab」是預設的分隔符,使用此選項可以更改為其他的分隔符

- -complement

此選項用於排除所指定的字段

- -output-delimiter

更改輸出內容的分隔符

通常用於判斷語句中,用來檢查某一字串是否滿足某一格式。

正規表示式是由普通字元和元字元組成。

普通字元包括大小寫字母,數字,標點符號及一些其他符號。

元字元是指在正規表示式中具有特殊意義的專用字元,可用來規定其前導字元(即位於元字元前面的字元)在目標物件中的出現模式。

\ :轉義字元,用於取消特殊符號的含義,例: \!、\n、\$等

^:匹配字串開始的位置,例:

^a、 ^the、 ^#、^

[a-z]

$ :匹配字串結束的位置,例: word$、 ^$匹配空行

.:匹配除\n之外的任意的乙個字元,例: go.d、 g..d*

:匹配前面子表示式0次或者多次,例: goo*d、 go.

*d[list]

:匹配list列表中的乙個字元,例: go[ola]d, [abc]、 [a-z]、 [a-z0-

9]、 [0-

9]匹配任意一位數字

[^list]

:匹配任意非list列表中的乙個字元,例:[^

0-9]、 [^a

-20-9

]、 [

^a-z]匹配任意一位非小寫字母

\:匹配前面的子表示式n次,例: go\d、 '[0-9]\ '匹配兩位數字

\:匹配前而的子表示式不少於n次,例: go\d、'[0-9]\'匹配兩位及兩位以上數字

\:匹配前面的子表示式n到m次,例: go\d、 ' [0-9]\'匹配兩位到三位數字

注: egrep、 awk使用、匹配時「」前不用加「\」

+

:匹配前面子表示式1次以上,例: go+d, 將匹配至少乙個o, 如god、 good、 goood等

?:匹配前面子表示式0次或者1次,例: go?d, 將匹配gd或god()

:將括號中的字串作為h乙個整體,例1:g

(oo)

+d," 將匹配oo整體1次以上,如good、gooood等

|:以或的方式匹配字條串,例:

g(oo|la)d," 將匹配good或者glad

查詢結果

正則匹配表

字元描述 轉義字元,在之前,我們在字串也用過這字元,即一些字元具有特殊含義,對其進行轉義使它成為普通字元,而用在普通字元上又表示其有特殊含義 匹配輸入字串的開始位置,如果設定了匹配多行 m 那麼也匹配行的開頭 匹配輸入字串的結束位置。如果設定了匹配多行 m 那麼也匹配行的結束 匹配前面的子表示式零次...

php 正則匹配http,php url正規表示式

本文章收集了三種關於從字串或文章內容中匹配url正規表示式的php 前二種函式是獲取以網域名稱為標題的http,後一種是匹配內容中的url位址並且儲存到陣列中哦。方法一 ereg str url hh tt pp ww 0 9a za z 0 9a za z a za z a za z 判斷乙個合法...

匯入匯出表以及表資料

一 開始進入執行 cmd 命令 匯出 所有表 exp system password 例項名 owner 使用者名稱 file d 自定義.dmp 臨時存放 指定表 exp system password 例項名 owner 使用者名稱 tables tbl1,tbl2,file d 自定義.dmp...