Python菜鸟晋级02----Python3的bytes与str,,Python 3最重


Python 3最重要的新特性大概要算是对文本和二进制数据作了更为清晰的区分。

文本总是Unicode,由str类型表示,二进制数据则由bytes类型表示。Python 3不会以任意隐式的方式混用str和bytes,正是这使得两者的区分特别清晰。你不能拼接字符串和字节包,也无法在字节包里搜索字符串(反之亦然),也不能将字符串传入参数为字节包的函数(反之亦然)。这是件好事。



不管怎样,字符串和字节包之间的界线是必然的,下面的图解非常重要,务请牢记于心:

技术分享

字符串可以编码成字节包,而字节包可以解码成字符串。

>>> "你好".encode("utf-8")                            #encode将字符串变成字节b'\xe4\xbd\xa0\xe5\xa5\xbd'>>> b'\xe4\xbd\xa0\xe5\xa5\xbd'.decode('utf-8')       #decode将字节变成字符串'你好'

当然编码也可以使用其他编码格式,例如GBK

>>> "你好".encode("GBK")b'\xc4\xe3\xba\xc3'>>> b'\xc4\xe3\xba\xc3'.decode("gbk")'你好'>>> 


上一讲:Python菜鸟晋级01----Python3.x和Python2.x的区别

下一讲:Python菜鸟晋级03----repr() 与str() 函数的区别

如果有什么疑问欢迎到我的微信公众号提问~技术分享


Python菜鸟晋级02----Python3的bytes与str

评论关闭