Linux文字處理命令

2021-04-13 07:11:50 字數 1657 閱讀 3062

4、linux文字處理命令sort命令

sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上,sort命令可以被認為是乙個非常強大的資料管理工具,用來管理內容類似資料庫記錄的檔案。

sort命令將逐行對檔案中的內容進行排序,如果兩行的首字元相同,該命令將繼續比較這兩行的下一字元,如果還相同,將繼續進行比較。

語法:

sort [選項] 檔案

說明:sort命令對指定檔案中所有的行進行排序,並將結果顯示在標準輸出上。如不指定輸入檔案或使用「- 」,則表示排序內容來自標準輸入。

sort排序是根據從輸入行抽取的乙個或多個關鍵字進行比較來完成的。排序關鍵字定義了用來排序的最小的字串行。預設情況下以整行為關鍵字按ascii字元順序進行排序。

改變預設設定的選項主要有:

- m 若給定檔案已排好序,合併檔案。 - c 檢查給定檔案是否已排好序,如果它們沒有都排好序,則列印乙個出錯資訊,並以狀態值1退出。

- u 對排序後認為相同的行只留其中一行。

- o 輸出檔案 將排序輸出寫到輸出檔案中而不是標準輸出,如果輸出檔案是輸入檔案之一,sort先將該檔案的內容寫入乙個臨時檔案,然後再排序和寫輸出結果。

改變預設排序規則的選項主要有:

- d 按字典順序排序,比較時僅字母、數字、空格和製表符有意義。 - f 將小寫字母與大寫字母同等對待。

- i 忽略非列印字元。

- m 作為月份比較:「jan」<「feb」

- r 按逆序輸出排序結果。

+posl - pos2 指定乙個或幾個字段作為排序關鍵字,字段位置從posl開始,到pos2為止(包括posl,不包括pos2)。如不指定pos2,則關鍵字為從posl到行尾。欄位和字元的位置從0開始。

- b 在每行中尋找排序關鍵字時忽略前導的空白(空格和製表符)。

- t separator 指定字元separator作為字段分隔符。

uniq命令

檔案經過處理後在它的輸出檔案中可能會出現重複的行。例如,使用cat命令將兩個檔案合併後,再使用sort命令進行排序,就可能出現重複行。這時可以使用uniq命令將這些重複行從輸出檔案中刪除,只留下每條記錄的唯一樣本。

語法:uniq [選項] 檔案

說明:這個命令讀取輸入檔案,並比較相鄰的行。在正常情況下,第二個及以後更多個重複行將被刪去,行比較是根據所用字符集的排序序列進行的。該命令加工後的結果寫到輸出檔案中。輸入檔案和輸出檔案必須不同。如果輸入檔案用「- 」表示,則從標準輸入讀取。

該命令各選項含義如下:

- c 顯示輸出中,在每行行首加上本行在檔案中出現的次數。它可取代- u和- d選項。 - d 只顯示重複行。

- u 只顯示檔案中不重複的各行。

- n 前n個字段與每個欄位前的空白一起被忽略。乙個欄位是乙個非空格、非製表符的字串,彼此由製表符和空格隔開(欄位從0開始編號)。

+n 前n個字元被忽略,之前的字元被跳過(字元從0開始編號)。

- f n 與- n相同,這裡n是字段數。

- s n 與+n相同,這裡n是字元數。

Linux文字處理命令

1.tac 它和cat是反的,倒著輸出,先輸出最後一行,接著是倒數第二行,最後輸出的是第一行 2.rev reverse 先輸出最後乙個字元,接著是倒數第二個字元,最後才是第乙個字元,下面這個命令可以把輸入全部倒過來 tac f.txt rev 3.head 只顯示文字的開頭幾行,比如 head 2...

linux文字處理命令

sed grep find xargs 1.替換檔案內容sed i s test01 test02 g grep rl test01 home forum 說明 在 home forum目錄下,grep出含有test01字串的檔案,然後把test01替換成test02 2.sed替換換行符參考 se...

linux 文字處理命令

cut 顯示切割的行資料 f 選擇顯示的列 s 不顯示沒有分隔符的行 d 自定義分隔符 sort 排序檔案的行 n 按數值排序 r 倒序 t 自定義分隔符 k 選擇排序列 u 合併相同行 f 忽略大小寫 sed options addresscommand file n 靜默模式,不再預設顯示模式空...