awk -f"[01]" '{}' 這種形式指定的分隔符是或的關係,即0或1作為分隔符;
awk -f"[0][1]" '{}' 這種形式指定的分隔符是合併的關係,即以「01」作為乙個字元為分隔符。
故假如有test.txt文字檔案只有一行:
1. mail from: [email protected] 2. subject:hello 3. data:2012-07-12 17:00 4. content:hello, the world. 5. 6. mail from: [email protected] 7. subject:congregation 8. data:2012-07-12 08:31 9. content:congregation to you. 10. 11. mail from: [email protected] 12. subject:test 13. data:2012-07-12 10:20 14. content:this is a test mail.
用命令:awk 'begin ' test.txt即可輸出如下格式的形式的檔案:
1 2 mail from: [email protected]
3 subject:hello
4 data:2012-07-12 17:00
5 content:hello, the world.
6
7 mail from: [email protected]
8 subject:congregation
9 data:2012-07-12 08:31
10 content:congregation to you.
11
12 mail from: [email protected]
13 subject:test
14 data:2012-07-12 10:20
15 content:this is a test mail.
awk分隔符設定為多個字元或字串
awk f 01 這種形式指定的分隔符是或的關係,即0或1作為分隔符 awk f 0 1 這種形式指定的分隔符是合併的關係,即以 01 作為乙個字元為分隔符。故假如有test.txt文字檔案只有一行 1.mail from tomcat gmail.com 2.subject hello 3.dat...
awk,分隔符編輯擷取字元
輸入字段分隔符 awk的內建變數fs中儲存了輸入字段分隔符的值。使用fs的預設值時,awk用空格或製表符來分隔字段,並且刪除各字段前多餘的空格或製表符。可以通過在begin語句中或命令列上賦值來改變fs的值。接下來我們就要在命令列上給fs指定乙個新的值。在命令列上改變fs的值需要使用 f選項,後面指...
Hive建表時指定分隔符或使用多字元分隔
不知道你是否會有會這樣的苦惱,就是從hdfs或者file中匯入資料到hive建數倉的時候,因為資料是資料流前段的小gg用特殊符號分隔的,然後導致你匯入資料時一臉矇圈?這篇教程可能會幫到你。首先我們明確,我們是在建表的時候就指定了匯入資料時的分隔符的,建表的時候會有三種場景需要考慮 1 正常建表 de...