文字統計分析工具指令

2022-06-25 01:30:15 字數 1245 閱讀 9993

檢視文字內容或者特殊控制符

cat  -a     

轉換和刪除字元 | 壓縮重複字元

3.去掉某個字串中的所有百分號或者其他的指定符號       tr -s "%" " "

cut -d 指明切割符號 -f

cut -c1-9  按每行中每個字元進行分割,包括空格字元.

取某個列的資料

2. 縱向合併    cat f1  f2 

-d  指定分隔符

-s 把每個檔案合併成行而不是按行貼上

- 對每乙個 ( - ),都從標準輸入中讀一次資料,使用空格作域分隔符號,以乙個6列的格式顯示就加- - - - - - 如果用三個- - -  就會以3列的格式顯示

wc預設統計檔案或者輸出有多少行,多少個單詞(空格隔開就算乙個單詞) 多少個位元組數.

取得某個列並且對這個列進行排序

-r 執行反方向(由上至下)

-r  隨機排序

-n 執行按數字大小整理

-f 選項忽略(fold)字串中的字元大小寫

-u 選項(獨特,unique)刪除輸出中的重複行

-t  c 選項使用c做為字段界定符(指定分割符號) 相當於 cut -d

-k  x 選項按照使用c字元分隔的x列來整理能夠使用多次(指定排序的列)   相當於 cut -f

把相鄰的重複行合併成一行

-c: 顯示每行重複出現的次數 

-d: 僅顯示重複過的行 

-u: 僅顯示不曾重複的行       

注:連續且完全相同方為重複 

檔案內容:less和 cat

檔案擷取:head和tail

按列抽取:cut

按關鍵字抽取:grep 

1       :%s/xyz/&er/g      把xyz字串 替換成 xyzer

統計分析的體會

客戶給了一張基本的資料表,然後讓我做大量的計算,並且動態 靜態的做統計分析報表,經過了長達兩個月的苦戰,終於作完了。體會如下 1 一張存放中間統計結果的表是必要的,如果能夠將客戶的統計分析需要經過計算才能顯示的字段囊括在內是最好不過了,畢竟在查詢的過程中作計算是一件很討厭的事,雖然有資料冗餘,但是簡...

資料的統計分析

資料預處理之後,我們要做一些統計分析,來觀察我們的資料,這其中包括 描述性分析 統計推斷。描述性分析 主要是統計指標 圖表。1 集中趨勢分析 除了分位數,我們還可以結合 中位數 眾數 平均數三者的關係。具體地 眾數在中位數左側,平均數在中位數右側,則此時資料呈正偏態分布,又叫右偏,存在極大異常值。是...

數學建模 統計分析

1.正整數頻率表 使用tabulate函式可以得到正整數的頻率表 t ceil 5 rand 1,10 隨機產生一組資料 table tabulate t 得到t的頻率表 t 324 2345 531table 1110 22203 33042 205220tabulate有乙個缺點是,它得到的是正...