探秘Python对象体系


Python之父Guido Rossum用自己的一个圣诞假期打造了Python语言,在Python的世界里,对象有着奇妙的“含义”。

一.C视角中的Python对象

让我们一起追溯到源头,Python由C语言实现,且向外提供了C的APIhttp://docs.python.org/c-api/index.html

我们思考问题的时候,可能对于对象这种东西很容易理解,而计算机能理解的只有0,1序列这样的字节序列,从根本上讲,我们所说的计算机语言中的对象只是在内存中的一块内存空间里的0,1序列而已,这些连续或者非连续的内存空间在更高层次上可以看作是一个整体.在Python中,我们所提到的一般的对象都是C中的结构体在堆Heap上申请的一块内存空间。

为了能够用C语言实现Python的面向对象的机制,需要定义一些结构体,能够操作那些对象的内存空间。

1.PyObject&PyVarObject

所有的Python对象都有一些共同的东西,我们将其高度抽象成一个结构体PyObject

  1. typedef struct _object{     
  2.     PyObject_HEAD     
  3. } PyObject;     
  4. //其实PyObject_HEAD这个宏在发行版本中的为     
  5. int ob_refcnt;     
  6. struct _typeobject *ob_type;    

ob_refcnt,就是对象引用计数,它的存在是为了实现了Python的基于引用技术的垃圾回收机制。还有一个是指向一个类型对象结构体的指针,用以代表该对象的类型.

在C语言的实现的时候,还有一个结构体扩展于PyObject,那便是PyVarObject,其内容为PyObject_VAR_HEAD这个宏,它比PyObject多了一个ob_size,用来表示变长对象的长度,详情见http://docs.python.org/c-api/structures.html

还有一点请大家不要搞混,这里的PyObject和PyVarObject和Python世界中的真实对象没有对应关系,这两个只是Python对象全体在C语言表示中的一种抽象.也就是说在C语言中,只要是一个Python对象结构体的数据,那么其内存的开始部分都会有上面结构体的几个变量,所以一个PyObject的指针便可以指向所有的C语言中的表示Python对象的结构体,这样在C语言的实现中,我们便可以通过这个统一的指针操作所有的内置的Python对象结构体了。

2.PyTypeObject

刚刚还有一个东西没有讲,那便是_typeobject(PyTypeObject)这个结构体,它是Python中所有类型对象的抽象,这样我们在C语言的层次里对于所有的类型对象结构体都可以通过PyTypeObject的指针来调用。

  1. typedef struct _typeobject {     
  2. //注意开始部分为PyObject_VAR_HEAD     
  3. PyObject_VAR_HEAD     
  4. char *tp_name; /* For printing, in format     
  5. "<module>.<name>" */    
  6. int tp_basicsize, tp_itemsize; /* For allocation */    
  7. /* Methods to implement standard operations */    
  8. destructor tp_dealloc;     
  9. printfunc tp_print;     
  10. ……     
  11. /* More standard operations (here for     
  12. binary compatibility) */    
  13. hashfunc tp_hash;     
  14. ternaryfunc tp_call;     
  15. ……     
  16. } PyTypeObject;    

3.Python内置对象和C结构体的对应

现在Python面向对象机制的对象和类型的抽象都已经说过了,接下来我们来看下在python中真实存在的对象在C语言实现的时候是怎么样的呢?

首先需要谈的是那些Python的内置对象,这些都是C语言定义了的,当Python环境初始化后,这些对象便创建好了。

  1. PyAPI_DATA(PyTypeObject) PyType_Type; /* built-in 'type' */    
  2. PyAPI_DATA(PyTypeObject) PyBaseObject_Type; /* built-in 'object' */   

object对象在Python中是一个比较基础的对象,它在C语言中对应的结构体是PyBaseObject_Type,从C语言中的这个命名我们可以大概知道这个类是一个类型对象。

还有就是Python中的<type 'type'>在C语言中对应着PyType_Type

  1. PyTypeObject PyType_Type = {     
  2. PyObject_HEAD_INIT(&PyType_Type)     
  3. 0, /* ob_size */    
  4. "type"/* tp_name */    
  5. sizeof(PyHeapTypeObject), /* tp_basicsize */    
  6. sizeof(PyMemberDef), /* tp_itemsize */    
  7. ……     
  8. };   

我们再看看比较具体的整数。

一个整数instance在C语言中的表示的结构体是PyIntObject

  1. typedef struct {     
  2. PyObject_HEAD     
  3. long ob_ival;     
  4. } PyIntObject;    

也就是说通过这样的结构体我们就可以在C语言的的运行时中指向Python的整数对象.

那么相应的我们Python的整数类型对象为

  1. yTypeObject PyInt_Type = {     
  2. PyObject_HEAD_INIT(&PyType_Type)     
  3. 0,     
  4. "int",     
  5. sizeof(PyIntObject),     
  6. ……     
  7. };    

4.自定义对象

当我们创建一个Python对象的时候,最终都是通过Python的底层来做的,当我们通过Python语言定义了自己的一个class A之后,Python首先根据你写的代码创建了一个A这样的class对象类对象),然后当你需要创建A的实例的时候,其实在Python的底层都是通过A这个Class对象进行创建的。

二.Python视角中的对象体系

在单纯的Python的世界中,一切都是对象.这些对象可以分为三类,

metaclasses,classes,instance

其中classes又可以分为内置的type和用户自定义的class

下面我们通过一张图片来作详细的说明

Python视角中的对象体系

其中C的定义的方式如下(python 中继承于某类直接写在类名后面的括号中):

  1. class C(object):     
  2.    ......    

其中实线表示 is-kind-of 的关系 ,虚线表示is-instance-of的关系。

查看当前classes对象(instances对象没有__bases__属性)的基类的时候,可以用过classes_name.__bases__进行查看,其值为一个Tuple元组(Python支持多继承).

查看当前对象的类型的方法是object_name.__class__

我们可以通过一些测试来证实上面的图:

这里,type为所有类的类。

相关内容

    暂无相关文章

评论关闭