Ptyhon gb2312代表什么意思?能表示繁体中文吗,,查了下gb2312只能表
Ptyhon gb2312代表什么意思?能表示繁体中文吗,,查了下gb2312只能表
查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。
<html><head> <title></title> <meta charset="gb2312"></head><body>简体中文繁體中文</body></html>
运行上面代码的时候,发现繁體中文可以正常显示的,并不会乱码,哪里错了吗?
摘自 Wiki GB 2312
GB2312 GB2312
GB 2312字符集并未包括繁体字,只有少数几个特例,这在维基百科GB 2312上有提到,所以如果严格按照GB 2312编码存储,会造成字符数据丢失。但是在Windows平台上当Locale是中国大陆时用非Unicode字符集进行汉字编码,默认会采用的是兼容GB 2312的GBK或GB 18030编码,这两个字符集都包含繁体字。
不能。繁体应当是Big5.
你到浏览器里面看看,当前是什么字符集。
在 Windows 上,GB2312 是 cp936 的别名,它是 GBK 或者 GB18030 我不太清楚了。
在其它平台,GB2312 还是真正的 GB2312,比如你在 Linux 上拿 Python 解析国内声明为 GB2312 的网页时一遇到生僻字或者繁体字就会报错了。
>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gb2312� ��iconv: 未知 16 处的非法输入序列>>> print -l 简体中文 繁體中文| iconv -f utf-8 -t gbk� ��
前一命令在「體」字上转码出错了,后一命令成功执行。
编橙之家文章,
相关内容
- 求Python同时操作多个变量方法,python同时多个变量,题干
- Python替换url内参数值的方式是什么,python替换url内参
- 请问Python Markdown和Markdown2高手们更推荐哪个,markdownm
- python2.7.3 uwsgi安装出错,python2.7.3uwsgi,系统信息:Linux v
- 求问Python归并排序求逆序数方法,python逆序,class nx:
- python django在nginx里模板输出html标签出错,djangonginx,就是
- Python与php在数据处理方面差异有哪些?,python数据处理
- Django项目删除最正确方法是什么,django项目方法,版本信
- 谁能讲解关于Python yield用途和作用,pythonyield,搜索了下
- Python xlwings插件报错跪求大神帮助,pythonxlwings,就这样了
评论关闭