Linux 文字處理

2021-08-13 17:47:58 字數 1812 閱讀 1976

author : janloong do_o

cat – 連線檔案並且列印到標準輸出

sort – 給文字行排序

uniq – 報告或者省略重複行

cut – 從每行中刪除文字區域

paste – 合併檔案文字行

join – 基於某個共享欄位來聯合兩個檔案的文字行

comm – 逐行比較兩個有序的檔案

diff – 逐行比較檔案

patch – 給原始檔案打補丁

tr – 翻譯或刪除字元

sed – 用於篩選和轉換文字的流編輯器

aspell – 互動式拼寫檢查器

cat -a   顯示出非列印字元

cat -n 給文字行新增行號

cat -s 禁止空白行輸出多個空白行(可以單個空白行)

選項

描述-b

–ignore-leading-blanks

預設情況下,對整行進行排序,從每行的第乙個字元開始。這個選項導致 sort 程式忽略 每行開頭的空格,從第乙個非空白字元開始排序。

-f–ignore-case

讓排序不區分大小寫。

-n–numeric-sort

基於字串的數值來排序。使用此選項允許根據數字值執行排序,而不是字母值。

-r–reverse

按相反順序排序。結果按照降序排列,而不是公升序。

-k–key=field1[,field2]

對從 field1到 field2之間的字元排序,而不是整個文字行。看下面的討論。

-m–merge

把每個引數看作是乙個預先排好序的檔案。把多個檔案合併成乙個排好序的檔案,而沒有執行額外的排序。

-o–output=file

把排好序的輸出結果傳送到檔案,而不是標準輸出。

-t–field-separator=char

定義域分隔字元。預設情況下,域由空格或製表符分隔。

example:

ls -l /usr/bin | sort -nr -k 5 | head

sort --key=1,1 --key=2n distros.txt

選項  說明

-c 輸出所有的重複行,並且每行開頭顯示重複的次數。

-d 只輸出重複行,而不是特有的文字行。

-f n 忽略每行開頭的 n 個字段,字段之間由空格分隔,正如 sort 程式中的空格分隔符;然而, 不同於 sort 程式,uniq 沒有選項來設定備用的字段分隔符。

-i 在比較文字行的時候忽略大小寫。

-s n 跳過(忽略)每行開頭的 n 個字元。

-u 只輸出獨有的文字行。這是預設的。

這個 cut 程式被用來從文字行中抽取文字,並把其輸出到標準輸出。它能夠接受多個檔案引數或者 標準輸入。

選項  說明

-c char_list 從文字行中抽取由 char_list 定義的文字。這個列表可能由乙個或多個逗號 分隔開的數值區間組成。

-f field_list 從文字行中抽取乙個或多個由 field_list 定義的字段。這個列表可能 包括乙個或多個字段,或由逗號分隔開的字段區間。

-d delim_char 當指定-f 選項之後,使用 delim_char 做為字段分隔符。預設情況下, 字段之間必須由單個 tab 字元分隔開。

--complement 抽取整個文字行,除了那些由-c 和/或-f 選項指定的文字。

linux 文字處理

1.文字處理 echo echo e 033 40 35m.背景顏色範圍 40 49 40 黑 41 深紅 42 綠 43 黃色 44 藍色 45 紫色 46 深綠 47 百色 字型顏色範圍 30 39 30 黑 31 紅 32 綠 33 黃 34 藍色 35 紫色 36 深綠 37 百色 eg e...

Linux文字處理命令

4 linux文字處理命令sort命令 sort命令的功能是對檔案中的各行進行排序。sort命令有許多非常實用的選項,這些選項最初是用來對資料庫格式的檔案內容進行各種排序操作的。實際上,sort命令可以被認為是乙個非常強大的資料管理工具,用來管理內容類似資料庫記錄的檔案。sort命令將逐行對檔案中的...

linux 文字處理一

linux中的一切都是檔案,所以對文字的處理變得很重要,下面介紹幾個常見的文字處理命令 cat cat的基本用法如下 上圖中我們建立了cattest.txt檔案,文字的開頭是乙個製表位,第一行位置有乙個換行。cat常用選項如下 在linux中有很多控制符號,如下圖所示 注 上表中的 k都可以使用ct...