**是這樣
1 htmlsource='charset="gbk
" />
'2 charset = re.findall('
',htmlsource)
開始想把'gbk'匹配出來,由於html檔案的meta標籤各個**的不一樣,於是只能按照上面的寫法,先匹配出『「gbk』
,再把"去掉,可是這麼天真的正規表示式卻匹配錯誤了,因為從地乙個"開始就已經把結果匹配出來了,所以結果只能是匹配錯了
然後改為
htmlsource=''charset = re.findall('
',htmlsource)
這樣就可以了
後來測試了一下,如果字串為
htmlsource=""gbk"
/>
"
或為
htmlsource=''gbk"
'/>'
結果都會出錯,因為外層引號會內層引號不能相同,否則就會報錯,所以一定要保持外層引號與內層引號不相同,不能全是單引號也不能全是雙引號,如果是那樣的話,字串本身就是錯誤的,,,,,,,(有點迷糊)
待續,,,,
正規表示式 匹配
字串 void abtr quint32 ab 表示乙個正規表示式 template class bidirectionaliterator class allocator std allocator sub match bidirectionaliterator class match resul...
正規表示式匹配
請實現乙個函式用來匹配包括 和 的正規表示式。模式中的字元 表示任意乙個字元,而 表示它前面的字元可以出現任意次 包含0次 在本題中,匹配是指字串的所有字元匹配整個模式。例如,字串 aaa 與模式 a.a 和 ab ac a 匹配,但是與 aa.a 和 ab a 均不匹配 解法 首先要想到用遞迴處理...
正規表示式匹配
請實現乙個函式用來匹配包括 和 的正規表示式。模式中的字元 表示任意乙個字元,而 表示它前面的字元可以出現任意次 包含0次 在本題中,匹配是指字串的所有字元匹配整個模式。例如,字串 aaa 與模式 a.a 和 ab ac a 匹配,但是與 aa.a 和 ab a 均不匹配 class solutio...