阐述Python PyString Object对象


Python PyString Object传入的参数必须是以NULL结尾的字符数组的指针,而PyString_FromStringAndSize不会有这样的要求,因为通过传入的size参数就可以确定需要拷贝的字符的个数

Python PyStringObject中的ob_shash变量其作用是缓存该对象的HASH值,这样可以避免每一次都重新计算该字符串对象的HASH值。如果一个PyStringObject对象还没有被计算过HASH值,那么ob_shash的初始值是-1。在计算一个对象的HASH值时,采用如下的算法:

  1. [stringobject.c]static long string_hash(PyStringObject *a){    
  2. register int len;     
  3. register unsigned char *p;   
  4. register long x;    
  5. if (a->ob_shash != -1)        
  6. return a->ob_shash;     
  7. len = a->ob_size;    
  8. p = (unsigned char *) a->ob_sval;    
  9. x = *p << 7;     
  10. while (--len >= 0)    
  11. x = (1000003*x) ^ *p++;    
  12. x ^= a->ob_size;     
  13.  if (x == -1)  
  14. x = -2;  
  15. a->ob_shash = x;  
  16. return x;}  

Python PyString Object对象的ob_sstate变量该对象是否被Intern的标志,关于PyStringObject的Intern机制,在后面会详细介绍,下面看一下PyStringObject对应的类型对象:

  1. [stringobject.c]   
  2. PyTypeObject PyString_Type = {    
  3.   PyObject_HEAD_INIT(&PyType_Type)    
  4.   0,    "str",    
  5.   sizeof(PyStringObject),     
  6.  sizeof(char),    ……    (reprfunc)string_repr,   
  7.        /* tp_repr */    &string_as_number,         
  8.  /* tp_as_number */    &string_as_sequence,        
  9.     /* tp_as_sequence */    &string_as_mapping,       
  10.   /* tp_as_mapping */    (hashfunc)string_hash,         
  11.  /* tp_hash */    0,                  /* tp_call */    ……    string_new,   
  12.           /* tp_new */    PyObject_Del,                   
  13.     /* tp_free */}; 

可以看到,在Python PyString Object的类型对象中,tp_itemsize被设置为sizeof(char),即一个字节。对于Python中的任何一种变长对象,tp_itemsize这个域是必须设置的,tp_itemsize指明了由变长对象保存的元素的单位长度,所谓单位长度即是指一个对象在内存中的长度。这个tp_itemsize和ob_size共同决定了应该额外申请的内存的总大小是多少。

  1. 如何使Python嵌入C++应用程序?
  2. 深入探讨Ruby与Python语法比较
  3. Python学习资料介绍分享
  4. Python学习经验谈:版本、IDE选择及编码解 决方案
  5. 浅析Python的GIL和线程安全

相关内容

    暂无相关文章

评论关闭