想想這輩子第一次寫部落格,心裡還有點小激動呢~
在寫python的爬蟲**時,發現找出的中文會被編碼成類似 \u4e16\u7ae0 這樣的,網上有人解釋可以通過
import sys
reload(sys)
sys.setdefaultencoding('gbk')
的方法來解決。但是當使用re.findall函式在網頁**找到自己需要的東西時,輸出的列表還是亂碼。例如
content=re.findall('(.*?)',rsponse,re.s)
print content
輸出的是
\u90dd\u6653\u98de
解決方法是要迴圈乙個乙個輸出:
content=re.findall('(.*?)',rsponse,re.s)[0]
print content
輸出的是
郝曉飛
發現python的編碼問題真心坑爹啊
第一次寫部落格
今天是我第一次寫自己的部落格 感到很激動 我是乙個程式設計師 之前一直看一些關於如何學習程式語言的貼子 大家都說學習一門語言 在於積累 而積累不能都考腦子儲存起來 需要整理成乙個自己的小金庫 在這個小金庫中有我在工作開發中遇到的乙個乙個的問題 我們往往對於新的問題要花費相對較長的時間去解決,對於我 ...
第一次寫部落格
這是我第一次寫部落格,也不知道到底該寫點什麼,感覺很多需要寫,但還是不那麼的自信,不論怎麼樣,還是希望能夠記錄一下自己作為一名程式猿這點點滴滴的事情,算是一段經歷吧。希望看到的人不要噴我。我是菜鳥,菜的不能再菜的鳥。大神就不要來嘲笑小弟了。剛開始寫程式還是跟著一群有志向大四的學長。可能就是這一點點的...
第一次寫部落格
第一篇文章 前兩天看見同學的朋友圈,很高興自己大學三年寫的部落格還是有人看的嗎。大學三年看過很多別人的很寫的部落格,也借鑑了很多人分享的資源。曾經很多次想過要開乙個自己的部落格,寫寫文章,寫寫 記錄一下平時學習中遇到的問題,可是每次都不了了之。ps 本人比較懶哈 國慶之後就要去深圳公司實習了,今天做...