在專案開發時,有時候想知道原始碼檔案中有多少字尾名為.cc、.c、.h的檔案。下面介紹linux幾種方法統計字尾名為.cc、.c、.h的檔案數的方法。
我以python3的源**為例,python3的原始碼共有檔案數:
這段時間在學習python3,我就把它作為例子啦。感慨下:python3跟python2比變化了好多!有興趣的同學可以從**庫中checkout**研究研究,過程如下:(python3使用git管理**)分別統計.cc和.c/.h的檔案數,然後加起來。
find . -name "*.cc" | wc -l ;find . -name "*.[c|h]" |wc -l結果如下:
雖然可以得到正確結果,不過就看上去比較醜。
find . \( -name "*.cc" -or -name "*.c" -or -name "*.h" \) |wc -l使用-or命令連線多個表示式,注意使用圓括號「()」把所有的-name表示式括起來,並且需要轉義!結果如下:
find . -iregex ".*\.\(cc\|h\|c\)$" |wc -l使用正規表示式,但是需要注意進行轉義。結果如下:
附常用正規表示式符號意義:推薦文章:【日常小記】linux中強大且常用命令:find、gre\將下乙個字元標記為乙個特殊字元、或乙個原義字元、或乙個後向引用、或乙個八進位制轉義符。
^匹配輸入字串的開始位置。如果設定了 regexp 物件的multiline 屬性,^ 也匹配 』\n』 或 』\r』 之後的位置。
$匹配輸入字串的結束位置。如果設定了 regexp 物件的multiline 屬性,$ 也匹配 』\n』 或 』\r』 之前的位置。
*匹配前面的子表示式零次或多次。
+匹配前面的子表示式一次或多次。+ 等價於 。
?匹配前面的子表示式零次或一次。? 等價於 。
n 是乙個非負整數,匹配確定的n 次。
n 是乙個非負整數,至少匹配n 次。
m 和 n 均為非負整數,其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數之間不能有空格。
?當該字元緊跟在任何乙個其他限制符 (*, +, ?, , , ) 後面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹配所搜尋的字串,而預設的貪婪模式則盡可能多的匹配所搜尋的字串。
.匹配除 「\n」 之外的任何單個字元。要匹配包括 』\n』 在內的任何字元,請使用象 』[.\n]』 的模式。
(pattern)匹配pattern 並獲取這一匹配。
(?:pattern)匹配pattern 但不獲取匹配結果,也就是說這是乙個非獲取匹配,不進行儲存供以後使用。
(?=pattern)正向預查,在任何匹配 pattern 的字串開始處匹配查詢字串。這是乙個非獲取匹配,也就是說,該匹配不需要獲取供以後使用。
(?!pattern)負向預查,與(?=pattern)作用相反
x|y匹配 x 或 y。
[xyz]字元集合。
[^xyz]負值字元集合。
[a-z]字元範圍,匹配指定範圍內的任意字元。
[^a-z]負值字元範圍,匹配任何不在指定範圍內的任意字元。
\b匹配乙個單詞邊界,也就是指單詞和空格間的位置。
\b匹配非單詞邊界。
\cx匹配由x指明的控制字元。
\d匹配乙個數字字元。等價於 [0-9]。
\d匹配乙個非數字字元。等價於 [^0-9]。
\f匹配乙個換頁符。等價於 \x0c 和 \cl。
\n匹配乙個換行符。等價於 \x0a 和 \cj。
\r匹配乙個回車符。等價於 \x0d 和 \cm。
\s匹配任何空白字元,包括空格、製表符、換頁符等等。等價於[ \f\n\r\t\v]。
\s匹配任何非空白字元。等價於 [^ \f\n\r\t\v]。
\t匹配乙個製表符。等價於 \x09 和 \ci。
\v匹配乙個垂直製表符。等價於 \x0b 和 \ck。
\w匹配包括下劃線的任何單詞字元。等價於』[a-za-z0-9_]』。
\w匹配任何非單詞字元。等價於 』[^a-za-z0-9_]』。
\xn匹配 n,其中 n 為十六進製制轉義值。十六進製制轉義值必須為確定的兩個數字長。
\num匹配 num,其中num是乙個正整數。對所獲取的匹配的引用。
\n標識乙個八進位制轉義值或乙個後向引用。如果 \n 之前至少 n 個獲取的子表示式,則 n 為後向引用。否則,如果 n 為八進位制數字 (0-7),則 n 為乙個八進位制轉義值。
\nm標識乙個八進位制轉義值或乙個後向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表示式,則 nm 為後向引用。如果 \nm 之前至少有 n 個獲取,則 n 為乙個後跟文字 m 的後向引用。如果前面的條件都不滿足,若 n 和 m 均為八進位制數字 (0-7),則 \nm 將匹配八進位制轉義值 nm。
\nml如果 n 為八進位制數字 (0-3),且 m 和 l 均為八進位制數字 (0-7),則匹配八進位制轉義值 nml。
\un匹配 n,其中 n 是乙個用四個十六進製制數字表示的unicode字元。
摘自《精通正規表示式》
日常小記 統計字尾名為 cc c h的檔案數
在專案開發時,有時候想知道原始碼檔案中有多少字尾名為.cc c h的檔案。下面介紹linux幾種方法統計字尾名為.cc c h的檔案數的方法。我以python3的源 為例,python3的原始碼共有檔案數 這段時間在學習python3,我就把它作為例子啦。感慨下 python3跟python2比變化...
日常小記 統計字尾名為 cc c h的檔案數
2011 03 29 16 50 by 吳秦,5801 閱讀,收藏,編輯在專案開發時,有時候想知道原始碼檔案中有多少字尾名為.cc c h的檔案。下面介紹linux幾種方法統計字尾名為.cc c h的檔案數的方法。我以python3的源 為例,python3的原始碼共有檔案數 這段時間在學習pyth...
獲取檔案的字尾名
使用api pathfindextension實現獲取給定乙個檔案,直接獲取檔案的字尾名 如 檔名 hsduiew.txt jhdsi.adiwey 路徑 檔名 c hsh shsh tetet.txt 都可以直接獲取到字尾名。pathfindextension函式說明 函式原型 ptstr pat...