如何在Linux中使用awk命令

2021-06-26 12:37:18 字數 2850 閱讀 4160

文字處理是unix的核心。從管道到/proc子系統,「一切都是檔案」的理念貫穿於作業系統和所有基於它構造的工具。正因為如此,輕鬆地處理文字是乙個期望成為linux系統管理員甚至是資深使用者的最重要的技能之一,而 awk是通用程式語言之外最強大的文字處理工具之一。

最簡單的awk的任務是從標準輸入中選擇字段;如果你對awk除了這個用途之外,從來沒了解過它的其他用途,你會發現它還是會是你身邊乙個非常有用的工具。

預設情況下,awk通過空格分隔輸入。如果您想選擇輸入的第乙個字段,你只需要告訴awk輸出$ 1:

$ echo 

'one two three four'

|awk

''

one

(是的,大括號語法是有點古怪,但我保證這是我們這節課一直會遇到。)

你能猜出如何選擇第二,第三或第四個欄位麼?是的,分別用$2,$ 3,$ 4。

$ echo 

'one two three four'

|awk

''

three

通常在文字改寫時,你需要建立乙個特定的資料格式,並且它覆蓋不止乙個單詞。好訊息是,awk中可以很容易地列印多個字段,甚至包含靜態字串:

$ echo 

'one two three four'

|awk

''

three one

$ echo 

'one two three four'

|awk

''

foo: three | bar: one

好吧,如果你的輸入不是由空格分隔怎麼辦?只需用awk中的'-f'標誌指定你的分隔符:

$ echo 

'one mississippi,two mississippi,three mississippi,four mississippi'

|awk -f

,''

four mississippi

偶爾間,你會發現自己正在處理字段數量不同的資料,但你只知道你想要的最後字段。 awk中內建的$nf變數代表欄位的數量,這樣你就可以用它來抓取最後乙個元素:

$ echo 

'one two three four'

|awk

''

four

你也可以用$nf做簡單的數學,假如你需要倒數第二個字段:

$ echo 

'one two three four'

|awk

''

three

甚至是中間的字段:

$ echo 

'one two three four'

|awk

''

three

而且這一切都非常有用,同樣你可以擺脫強制使用sed,cut,和grep來得到這些結果(儘管要做更多的操作)。

因此,我將最後為你介紹awk的乙個特性,維持跨行狀態。

$ echo -e 

'one 1\ntwo 2'

|awk

''

1

2

$ echo -e 

'one 1\ntwo 2'

|awk

' end '

3

(end代表的是我們在執行完每行的處理之後只處理下面的**塊)

這裡我使用的例子是統計web伺服器請求日誌的位元組大小。想象一下我們有如下這樣的日誌:

我們知道最後乙個欄位是響應的位元組大小。我們已經學習了如何使用$nf來抽取他們:

$ 

<

requests

.log awk

''

344

9300

9300

6401

6312

接著我們可以將它們累加到乙個變數中來收集我們的web服務其在日誌中這段時間內的響應客戶端的位元組數量

$ 

<

requests

.log awk

' end '

31657

如果你正在尋找關於awk的更多資料,你可以在amazon中花費不到15美元買到原始awk手冊的二手書。你也許還可以看看eric pement的單行awk命令收集這本書。

via: 

linux中使用awk命令

awk的取名是貝爾實驗室的alfred.aho和peter.weinberger和brain.kernigham三個人的名字取首字母組成的。awk命令能從乙個或多個文字檔案或字串中逐個記錄或逐行掃瞄 將每個記錄與匹配模式相比較 當發現匹配格式時抽取資料或格式化報文,或執行相應的文字操作。awk命令格...

如何在linux程式中使用printk

from 要將linux核心的帶級別控制的printk內容列印出來,在命令列 輸入 dmesg n 8 就將所有級別的資訊都列印出來 linux命令 dmesg 功能說明 顯示開機資訊。語 法 dmesg cn s 緩衝區大小 補充說明 kernel會將開機資訊儲存在ring buffer中。您若是...

Linux 如何在Gaim中使用Gtalk

google talk使用了jabber協議,因此linuxfans可以很輕鬆地使用google的服務,設定如下 登入選項 協議 jabber 使用者名稱 gmail郵箱字首 伺服器 gmail.com 資源 google talk 密碼 gmail郵箱密碼 顯示主要選項 jabber選項 選中 若...