V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ufo22940268
V2EX  ›  问与答

python里面越晚从unicode转换成string越好吗?

  •  
  •   ufo22940268 · 2013-07-08 10:32:45 +08:00 · 2957 次点击
    这是一个创建于 4147 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我现在在做一个项目,用BeautifulSoup从网上抓一些数据。虽然BeautifulSoup的构造方法里面有一个fromencoding的参数,但是我也不知道是不是指定了这个参数之后获得的unicode是不是就是"utf-8"了。

    然后我曾经在python的文档里面看到,python内部处理的时候应该用unicode来处理,而不是string,换句话说越晚调用encode("utf-8")越好。那我就比较费解了,如果说这个unicode对象有可能是utf-8的,也可能是gbk的,那么在程序里面越后面的代码就越难区别这个unicode的编码是什么?那这个问题怎么解决呢?如果及早地转换成string就不存在这个问题。
    4 条回复    1970-01-01 08:00:00 +08:00
    ufo22940268
        1
    ufo22940268  
    OP
       2013-07-08 10:40:17 +08:00
    ritksm
        2
    ritksm  
       2013-07-08 10:43:33 +08:00   ❤️ 1
    unicode对象怎么可能是gbk的 只有bytes(也就是所谓string呗)才能说是“用gbk编码的”吧
    swulling
        3
    swulling  
       2013-07-08 10:50:19 +08:00   ❤️ 1
    你应该先了解下Python2中的Unicode,就不会说 Unicode可能是gbk了。。。
    ufo22940268
        4
    ufo22940268  
    OP
       2013-07-08 11:36:41 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1074 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 22:41 · PVG 06:41 · LAX 14:41 · JFK 17:41
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.