类似测&#35797这种编码如何用python转换成汉字,,整理了以下几种编码:编码
类似测试这种编码如何用python转换成汉字,,整理了以下几种编码:编码
整理了以下几种编码:
编码1:测试
编码2:\u6d4b\u8bd5
编码3:测试
编码4:%e6%b5%8b%e8%af%95
在编程过程中,经常会碰到很多的编码格式的数据,现在自己对于N多的编码格式还是一头雾水。
不知道大家是怎么准确识别各种编码的呢?
另外:使用python如何得到此种编码测试所对应的中文呢?
余兴节目。
前三个都是Unicode原始值,最后一个是UTF-8。简单的用Python说明一下:
>>> s=b'\xe6\xb5\x8b\xe8\xaf\x95'>>> print(s.decode('utf-8'))测试>>> u=u'\u6d4b\u8bd5'>>> print(u)测试
每个Unicode字符的编码只有一个,表示为一个或长或短的十六进制数。但把一串Unicode转换成真正用于存储和传输的字节序列,办法很多。UTF-8就是使用最广泛(绝大多数情况下也应该使用)的一种Unicode编码方法。
至于格式的不同,只是用的地方不一样,用不同的格式封一下。我记得编码1和3是HTML实体,2是Python的Unicode字符表示法,4是URL中不能直写字符的转义表示法。
1 和 3 是HTML实体,可以通过标准库HTMLParser 来解析:
#coding=utf8import HTMLParserparser = HTMLParser.HTMLParser()s1 = parser.unescape('测试')print s1# output: 测试s2 = parser.unescape('测试')print s2# output: 测试
2 是unicode 字面值,要想获得真正的unicode,可以这样做:
In [1]: u = unicode('\u6d4b\u8bd5', 'unicode_escape')In [2]: uOut[2]: u'\u6d4b\u8bd5'In [3]: print u测试
编橙之家文章,
相关内容
- SQLAlchemy缓存数据生成原理是什么,sqlalchemy原理,我现在
- Flask Web开发第6章 程序中集成发送电子邮件功能 raise
- 中小型网站开发用SQLObject和peewee哪个更适,sqlobjectpee
- Python requests抓取速度变慢求分享应对经验,pythonreques
- 同样源码把requests库替换成scrapy抓取内容就报500错误,是
- 求帮分析python源码,路由不跳转的设置问题,python源码
- python缺陷吗try...except,except里只要有对应第一个try的错
- Python高效处理机制问题求助,python机制问题求助,求教比
- 邮件提示功能是如何用实现的,python能做吗?,邮件pyth
- django1.7获取参数问题求助,django1.7问题求助,这是网站结
评论关闭