问题是这样的
我有一个dict叫content.
其中 content['title']的值是'aaaa\u2019bbbb'
我该如何把它转换成"aaaa'bbbb"
尝试了
python
text=content['title']
result=re.search(r'(\\u\d\d\d\d)',text)
utf8_value=result.encode('utf-8')
final=re.sub(r'\\u\d\d\d\d',utf8_value,text)
本想用 u'aaaa\u2019bbbb'.encode('utf-8'),但是这里不知道该怎样写出u'aaaa\u2019bbbb',尝试了(u'%s' % result).encode('utf-8'),没有用
1
bottleimp 2015-05-29 13:07:25 +08:00
不明白你说的意思, 不是直接就可以吗, python2.7
``` In [4]: s = u'aaaa\u2019bbbb' In [5]: s Out[5]: u'aaaa\u2019bbbb' In [6]: print s aaaa’bbbb ``` |
2
Sylv 2015-05-29 13:23:34 +08:00 via iPhone
'aaaa\u2019bbbb'.decode('unicode_escape')
字符串中的 '\u2019' 并不是一个 Unicode 字符,而是 6 个字符 |
3
yahoo21cn 2015-05-29 13:24:30 +08:00
content['title'] = content['title'].replace(u"’", u"'")
|
5
fzinfz 2015-05-29 14:44:20 +08:00
unicode还是用PY3吧。。。
|
6
ming2281 2015-05-29 15:38:36 +08:00
=>使用Python3.x
=>全部使用Unicode, 如 name = u"lucy" regx_pattern = ur"xx" =>使用utf-8编码当做桥梁 其中第三种方法在Python2中非常好,需要首先了解字符编码问题 |
7
imn1 2015-05-29 17:36:36 +08:00
json ...
|