ibluemonkey's
embrace change
2013年4月3日 星期三
Python parse 編碼為big5的網頁
1. 怎麼確定網頁的編碼
打開網頁的原始碼
搜尋"charset"
以下面的圖為例
上面寫big5應該就是big5
如果找不到的話我也不確定XD
2. 抓回來的資料想編碼成utf8
read()的時候就要選擇decode('big5')
參考網頁
http://blog.raphaelzhang.com/2012/03/issues-in-python-crawler/
http://www.g2w.me/2011/04/python-decoding-big5/
沒有留言:
張貼留言
較新的文章
較舊的文章
首頁
訂閱:
張貼留言 (Atom)
沒有留言:
張貼留言