linux grep sed和awk的區別

2021-08-25 11:28:06 字數 2890 閱讀 5787

grep, sed 與 awk 相當有用 !

gerp 查詢, sed 編輯, awk 根據內容分析並處理.

awk(關鍵字:分析&處理)一行一行的分析處理 awk '條件型別1條件型別2' filename, awk 也可以讀取來自前乙個指令的 standard input

相對於sed常常用於一整行處理, awk則比較傾向於一行當中分成數個"字段"(區域)來處理, 預設的分隔符是空格鍵或tab鍵

例如:last -n 5 | awk '' 這裡大括號內$1"\t"$3 之間不加空格也可以, 不過最好還是加上個空格, 另外注意"\t"是有雙引號的, 因為本身這些內容都在單引號內

$0 代表整行 $1代表第乙個區域, 依此類推

awk的處理流程是:

1. 讀第一行, 將第一行資料填入變數 $0, $1... 等變數中

2. 依據條件限制, 執行動作

3. 接下來執行下一行

所以, awk一次處理是一行, 而一次中處理的最小單位是乙個區域

另外還有3個變數, nf: 每一行處理的字段數, nr 目前處理到第幾行 fs 目前的分隔符

邏輯判斷 > < >= <= == !== , 賦值直接使用=

cat /etc/passwd | awk ' $3<10 ' 首先定義分隔符為:, 然後判斷, 注意看, 判斷沒有寫在{}中, 然後執行動作, fs=":"這是乙個動作, 賦值動作, 不是乙個判斷, 所以不寫在{}中

begin end , 給程式設計師乙個初始化和收尾的工作, begin之後列出的操作在{}內將在awk開始掃瞄輸入之前執行, 而end{}內的操作, 將在掃瞄完輸入檔案後執行.

awk '/test/ ' abc 將帶有test的行的行號列印出來, 注意//之間可以使用正規表示式

awk {}內, 可以使用 if else ,for(i=0;i<10;i++), i=1 while(iawk 是相當複雜的工具, 真正使用時, 再補充吧. (有關工具的picture)

sed(關鍵字: 編輯)以行為單位的文字編輯工具 sed可以直接修改檔案, 不過一般不推薦這麼做, 可以分析 standard input

基本工作方式: sed [-nef] '[動作]' [輸入文字]

-n : 安靜模式, 一般sed用法中, 來自stdin的資料一般會被列出到螢幕上, 如果使用-n引數後, 只有經過sed處理的那一行被列出來.

-e : 多重編輯, 比如你同時又想刪除某行, 又想改變其他行, 那麼可以用 sed -e '1,5d' -e 's/abc/***/g' filename

-f : 首先將 sed的動作寫在乙個檔案內, 然後通過 sed -f scriptfile 就可以直接執行 scriptfile 內的sed動作 (沒有實驗成功, 不推薦使用)

-i : 直接編輯, 這回就是真的改變檔案中的內容了, 別的都只是改變顯示. (不推薦使用)

動作:a 新增, a 後面可以接字串, 而這個字串會在新的一行出現. (下一行)

c 取代, c 後面的字串, 這些字串可以取代 n1,n2之間的行

d 刪除, 後面不接任何東西

i 插入, 後面的字串, 會在上一行出現

p 列印, 將選擇的資料列出, 通常和 sed -n 一起運作 sed -n '3p' 只列印第3行

s 取代, 類似vi中的取代, 1,20s/old/new/g

[line-address]q 退出, 匹配到某行退出, 提高效率

[line-address]r 匹配到的行讀取某檔案 例如: sed '1r qqq' abc , 注意, 寫入的文字是寫在了第1行的後邊, 也就是第2行

[line-address]w file, 匹配到的行寫入某檔案  例如: sed -n '/m/w qqq' abc , 從abc中讀取帶m的行寫到qqq檔案中, 注意, 這個寫入帶有覆蓋性.

舉例:sed '1d' abc 刪除 abc 檔案裡的第一行, 注意, 這時會顯示除了第一行之外的所有行, 因為第一行已經被刪除了(實際檔案並沒有被刪除,而只是顯示的時候被刪除了)

sed -n '1d' abc 什麼內容也不顯示, 因為經過sed處理的行, 是個刪除操作, 所以不現實.

sed '2,$d' abc 刪除abc中從第二行到最後一行所有的內容, 注意, $符號正規表示式中表示行末尾, 但是這裡並沒有說那行末尾, 就會指最後一行末尾, ^開頭, 如果沒有指定哪行開頭, 那麼就是第一行開頭

sed '$d' abc 只刪除了最後一行, 因為並沒有指定是那行末尾, 就認為是最後一行末尾

sed '/test/d' abc 檔案中所有帶 test 的行, 全部刪除

sed '/test/a rrrrrrr' abc 將 rrrrrrr 追加到所有的帶 test 行的下一行 也有可能通過行 sed '1,5c rrrrrrr' abc

sed '/test/c rrrrrrr' abc 將 rrrrrrr 替換所有帶 test 的行, 當然, 這裡也可以是通過行來進行替換, 比如 sed '1,5c rrrrrrr' abc

grep(關鍵字: 擷取)文字蒐集工具, 結合正規表示式非常強大

主要引數

-c : 只輸出匹配的行

-i : 不區分大小寫

-h : 查詢多檔案時不顯示檔名

-l : 查詢多檔案時, 只輸出包含匹配字元的檔名

-n : 顯示匹配的行號及行

-v : 顯示不包含匹配文字的所有行(我經常用除去grep本身)

基本工作方式: grep 要匹配的內容 檔名, 例如:

grep 'test' d* 顯示所有以d開頭的檔案中包含test的行

grep 'test' aa bb cc 顯示在 aa bb cc 檔案中包含test的行

grep '[a-z]\\' aa 顯示所有包含字串至少有5個連續小寫字母的串

如何傳遞shell變數給aw

一 var 這種寫法大家無需改變用 括起awk程式的習慣,是老外常用的寫法.如 var test awk begin 這種寫法其實際是雙括號變為單括號的常量,傳遞給了awk.如果var中含空格,為了shell不把空格作為分格符,便應該如下使用 var this is a test awk begin...

AW291 蒙德里安的夢想

題目位址 易錯點 結論1 在合法狀態下,對於每個橫塊的正上方兩個格仔中任意乙個格仔,一定屬於某個橫塊的一部分或某個豎塊的下半部.證明 假設有乙個橫塊的正上方兩格中的某格為乙個豎塊的上半部,由定義可知該情況不成立.對於任意乙個格仔,只有可能為以下三種狀態之一 豎塊上半部 豎塊下半部 半個橫塊.由 1 ...

ssh登入指令碼 expect語言中使用awk

五一勞動節被叫過去加班,要公升級程式,有100多台的伺服器。需要先登入伺服器,再將伺服器上的程式停掉,伺服器上的程式程序是用screen建立的,ps ef 他的程序pid 然後kill掉 usr bin expect set ipaddr lindex argv 0 spawn ssh ict ip...