python 模块介绍 - Base16, Base32, Base64 数据编码,,简介功能:RFC 3


简介

功能:RFC 3548: Base16, Base32, Base64 数据编码。转换二进制数据为适合明文协议传输的 ASCII 序列。转换
8bits 为每个字节包含 6,5 或 4bits 的有效数据,比如 SMTP, URL 的一部分或者 HTTP POST 的一部分。参考:
RFC 3548。编码算法不同于 uuencode。
类型:标准库
相关模块:uu, binhex, uu, quopri


Base64 是一种基于 64 个可打印字符来表示二进制数据的表示方法。由于 2 的 6 次方等于 64,所以每 6
个位元为一个单元,对应某个可打印字符。三个字节有 24 个位元,对应于 4 个 Base64 单元,即 3 个字节
需要用 4 个可打印字符来表示。它可用来作为电子邮件的传输编码。在 Base64 中的可打印字符包括字母 A-
Z、a-z、数字 0-9,这样共有 62 个字符,此外两个可打印符号在不同的系统中而不同。之后在 6 位的前面补
两个 0,形成 8 位一个字节的形式。一些如 uuencode 的其他编码方法,和之后 binhex 的版本使用不同的
64 字符集来代表 6 个二进制数字,但是它们不叫 Base64。


Base64 常用于在通常处理文本数据的场合,表示、传输、存储一些二进制数据。包括 MIME 的
email,email via MIME,在 XML 中存储复杂数据。

Python Base64 模块提供了 RFC3548 中的数据编码和解码(转换二进制数据为适合明文协议传输的
ASCII 序列,如 RFC3548 中指定。该标准定义了 Base16,Base32 和 Base64 算法,编码和解码的任意二进制字符串转换为文本字符串,这样就可以通过电子邮件安全发送,作为网址的一部分,或包含在 HTTP POST 请求中。


Base64 模块提供两个接口。新式接口支持使用三个字母的编码和解码的字符串对象。传统接口提供了编
码和解码文件对象和字符串,但只使用了标准的 Base64 字母。传统接口这里不做介绍。


base64、 base32、 base16 可以分别编码转化 8 位字节为 6 位、 5 位、 4 位。 16,32,64 分别表示用多少个字
符来编码。


更多 base64 的资料,参见
http://zh.wikipedia.org/wiki/Base64,http://tools.ietf.org/html/rfc822,http://tools.ietf.org/html/rfc14
21,http://tools.ietf.org/html/rfc2045。

快速入门

请看 python 模块介绍中的实例:

>>>importbase64>>>encoded=base64.b64encode(‘datatobeencoded‘)>>>encoded‘ZGF0YSB0byBiZSBlbmNvZGVk‘>>>data=base64.b64decode(encoded)>>>data‘datatobeencoded‘

base64.b64encode(s[, altchars]):使用 Base64 编码字符串。s 是要编码的字符串。altchars 是用来替换+和/的字符串,它们在 url 和文件系统中它们有特殊含义,通常需要替换。
base64.b64decode(s[, altchars]): 解码 Base64 编码的字符串。s 为要解码的字符串。altchars 和b64encode 相同。
? base64.standard_b64encode ( s ) : 参考 b64encode。
? base64.standard_b64decode ( s ) :参考 b64decode。

Base64 编码解码


Base64 编码解码

#!/usr/bin/envpython#encoding:utf-8##Copyright(c)2008DougHellmannAllrightsreserved.#""""""__version__="$Id$"#end_pymotw_headerimportbase64importtextwrap#Loadthissourcefileandstriptheheader.withopen(__file__,‘rt‘)asinput:raw=input.read()initial_data=raw.split(‘#end_pymotw_header‘)[1]encoded_data=base64.b64encode(initial_data)num_initial=len(initial_data)#Therewillneverbemorethan2paddingbytes.padding=3-(num_initial%3)print‘%dbytesbeforeencoding‘%num_initialprint‘Expect%dpaddingbytes‘%paddingprint‘%dbytesafterencoding‘%len(encoded_data)printprintencoded_data

?执行结果

$pythonbase64_b64encode.py168bytesbeforeencodingExpect3paddingbytes224bytesafterencodingCgppbXBvcnQgYmFzZTY0CmltcG9ydCB0ZXh0d3JhcAoKIyBMb2FkIHRoaXMgc291cmNlIGZpbGUgYW5kIHN0cmlwIHRoZSBoZWFkZXIuCndpdGggb3BlbihfX2ZpbGVfXywgJ3J0JykgYXMgaW5wdXQ6CiAgICByYXcgPSBpbnB1dC5yZWFkKCkKICAgIGluaXRpYWxfZGF0YSA9IHJhdy5zcGxpdCgn

Base64 编码的 4 个字节对应实际的 3 个字节,不足四个字节时,后面部分通常用等号填充。极端的情况下,
一个字节需要用 4 个 Base64 编码来表示。

>>>importbase64>>>encoded=base64.b64encode(‘a‘)>>>encoded‘YQ==‘

Base64 解码参见快速入门部分介绍。


URL-Safe

?base64.urlsafe_b64encode(s):
?base64.urlsafe_b64decode(s):
Base64 默认会使用+和/, 但是这 2 个字符在 url 中也有特殊含义。使用 urlsafe 可以解决这个问题。 +替换为-,
/替换为_。

importbase64encodes_with_pluses=chr(251)+chr(239)encodes_with_slashes=chr(255)*2fororiginalin[encodes_with_pluses,encodes_with_slashes]:print‘Original:‘,repr(original)print‘Standardencoding:‘,base64.standard_b64encode(original)print‘URL-safeencoding:‘,base64.urlsafe_b64encode(original)print

?执行结果

$pythonbase64_urlsafe.pyOriginal:‘\xfb\xef‘Standardencoding:++8=URL-safeencoding:--8=Original:‘\xff\xff‘Standardencoding://8=URL-safeencoding:__8=

其他编码

Base32 包含 26 个大写字母和 2-7 的数字。
? base64.b32encode(s):使用 Base32 编码字符串。s 是要编码的字符串。
? base64.b32decode(s[, casefold[, map01]]):解码 Base32 编码的字符串。s 为要解码的字符串 。
casefold 表示是否允许小写字母。 map01 表示允许 0 表示 0,1 表示 L 。

importbase64original_string=‘Thisisthedata,intheclear.‘print‘Original:‘,original_stringencoded_string=base64.b32encode(original_string)print‘Encoded:‘,encoded_stringdecoded_string=base64.b32decode(encoded_string)print‘Decoded:‘,decoded_string


?执行结果

$pythonbase64_base32.pyOriginal:Thisisthedata,intheclear.Encoded:KRUGS4ZANFZSA5DIMUQGIYLUMEWCA2LOEB2GQZJAMNWGKYLSFY======Decoded:Thisisthedata,intheclear.

Base16 包含 16 个 16 进制大写数字。类似的有 base64.b16encode(s) ,base64.b16decode(s[,
casefold]) 。

importbase64original_string=‘Thisisthedata,intheclear.‘print‘Original:‘,original_stringencoded_string=base64.b16encode(original_string)print‘Encoded:‘,encoded_stringdecoded_string=base64.b16decode(encoded_string)print‘Decoded:‘,decoded_string

?
执行结果

$pythonbase64_base16.pyOriginal:Thisisthedata,intheclear.Encoded:546869732069732074686520646174612C20696E2074686520636C6561722EDecoded:Thisisthedata,intheclear.Python3.4中增加了Ascii85和base85支持。这里暂不做详细介绍。函数如下:?base64.a85encode(s,*,foldspaces=False,wrapcol=0,pad=False,adobe=False)?base64.a85decode(s,*,foldspaces=False,adobe=False,ignorechars=b‘tnrv‘)?base64.b85encode(s,pad=False)?base64.b85decode(b)


作者博客:http://my.oschina.net/u/1433482

类型:翻译加整理

本文最新pdf版本下载。本文最初基于libreoffice的odt格式创建,拷贝过来格式有部分变化,建议查看原来的pdf。

python2 官方网址:http://docs.python.org/2/library/base64.html

python3 官方网址:https://docs.python.org/3/library/base64.html

python 标准库 pymotw:http://pymotw.com/2/base64/index.html#module-base64


python 模块介绍 - Base16, Base32, Base64 数据编码

相关内容

    暂无相关文章

评论关闭