http://groups.google.com/group/python-cn/browse_thread/thread/a601a5b202e7c65e python抓取中文网页内容是[u'\xbe\xaf\xcc\xe8\xba\xab\xba\xae……
>>> s = u'\xbe\xaf\xcc\xe8'
>>> s.encode('raw_unicode_escape')
'\xbe\xaf\xcc\xe8'
>>> s.encode('raw_unicode_escape').decode('gbk')
u'\u8b66\u60d5'
>>> print s.encode('raw_unicode_escape').decode('gbk')
警惕
(以上是俺在 pys60 上跑的)
--
没有评论:
发表评论