2.7. 生成器(generator)

生成器是调用一个生成器函数(generator function)返回的对象,多用于集合对象的迭代。

•__iter__: 仅仅是一个可迭代的标记。

•gi_code: 生成器对应的code对象。

•gi_frame: 生成器对应的frame对象。

•gi_running: 生成器函数是否在执行。生成器函数在yield以后、执行yield的下一行代码前处于frozen状态,此时这个属性的值为0。

•next|close|send|throw: 这是几个可调用的方法,并不包含元数据信息,如何使用可以查看生成器的相关文档。

  1. def gen():  
  2.     for n in xrange(5):  
  3.         yield n  
  4. g = gen()  
  5. print g               
  6. print g.gi_code       
  7. print g.gi_frame      
  8. print g.gi_running  # 0  
  9. print g.next()      # 0  
  10. print g.next()      # 1  
  11. for n in g:  
  12.     print n,        # 2 3 4  

接下来讨论的是几个不常用到的内置对象类型。这些类型在正常的编码过程中应该很少接触,除非你正在自己实现一个解释器或开发环境之类。所以这里只列出一部分属性,如果需要一份完整的属性表或想进一步了解,可以查看文末列出的参考文档。

  2.8. 代码块(code)

代码块可以由类源代码、函数源代码或是一个简单的语句代码编译得到。这里我们只考虑它指代一个函数时的情况;2.5节中我们曾提到可以使用函数的func_code属性获取到它。code的属性全部是只读的。

•co_argcount: 普通参数的总数,不包括*参数和**参数。

•co_names: 所有的参数名(包括*参数和**参数)和局部变量名的元组。

•co_varnames: 所有的局部变量名的元组。

•co_filename: 源代码所在的文件名。

•co_flags: 这是一个数值,每一个二进制位都包含了特定信息。较关注的是0b100(0x4)和0b1000(0x8),如果co_flags & 0b100 != 0,说明使用了*args参数;如果co_flags & 0b1000 != 0,说明使用了**kwargs参数。另外,如果co_flags & 0b100000(0x20) != 0,则说明这是一个生成器函数(generator function)。

  1. co = cat.sayHi.func_code  
  2. print co.co_argcount        # 1  
  3. print co.co_names           # ('name',)  
  4. print co.co_varnames        # ('self',)  
  5. print co.co_flags & 0b100   # 0  

  2.9. 栈帧(frame)

栈帧表示程序运行时函数调用栈中的某一帧。函数没有属性可以获取它,因为它在函数调用时才会产生,而生成器则是由函数调用返回的,所以有属性指向栈帧。想要获得某个函数相关的栈帧,则必须在调用这个函数且这个函数尚未返回时获取。你可以使用sys模块的_getframe()函数、或inspect模块的currentframe()函数获取当前栈帧。这里列出来的属性全部是只读的。

•f_back: 调用栈的前一帧。

•f_code: 栈帧对应的code对象。

•f_locals: 用在当前栈帧时与内建函数locals()相同,但你可以先获取其他帧然后使用这个属性获取那个帧的locals()。

•f_globals: 用在当前栈帧时与内建函数globals()相同,但你可以先获取其他帧……。

  1. def add(x, y=1):  
  2.     f = inspect.currentframe()  
  3.     print f.f_locals    # same as locals()  
  4.     print f.f_back        
  5.     return x+y  
  6. add(2)  

2.10. 追踪(traceback)

追踪是在出现异常时用于回溯的对象,与栈帧相反。由于异常时才会构建,而异常未捕获时会一直向外层栈帧抛出,所以需要使用try才能见到这个对象。你可以使用sys模块的exc_info()函数获得它,这个函数返回一个元组,元素分别是异常类型、异常对象、追踪。traceback的属性全部是只读的。

•tb_next: 追踪的下一个追踪对象。

•tb_frame: 当前追踪对应的栈帧。

•tb_lineno: 当前追踪的行号。

  1. def div(x, y):  
  2.     try:  
  3.         return x/y  
  4.     except:  
  5.         tb = sys.exc_info()[2]  # return (exc_type, exc_value, traceback)  
  6.         print tb  
  7.         print tb.tb_lineno      # "return x/y" 的行号  
  8. div(1, 0)  

  3. 使用inspect模块

inspect模块提供了一系列函数用于帮助使用自省。下面仅列出较常用的一些函数,想获得全部的函数资料可以查看inspect模块的文档。

  3.1. 检查对象类型

•is{module|class|function|method|builtin}(obj):

检查对象是否为模块、类、函数、方法、内建函数或方法。

•isroutine(obj):

用于检查对象是否为函数、方法、内建函数或方法等等可调用类型。用这个方法会比多个is*()更方便,不过它的实现仍然是用了多个is*()。

  1. im = cat.sayHi  
  2. if inspect.isroutine(im):  
  3.     im()  

对于实现了__call__的类实例,这个方法会返回False。如果目的是只要可以直接调用就需要是True的话,不妨使用isinstance(obj, collections.Callable)这种形式。我也不知道为什么Callable会在collections模块中,抱歉!我猜大概是因为collections模块中包含了很多其他的ABC(Abstract Base Class)的缘故吧:)

3.2. 获取对象信息

•getmembers(object[, predicate]):

这个方法是dir()的扩展版,它会将dir()找到的名字对应的属性一并返回,形如[(name, value), ...]。另外,predicate是一个方法的引用,如果指定,则应当接受value作为参数并返回一个布尔值,如果为False,相应的属性将不会返回。使用is*作为第二个参数可以过滤出指定类型的属性。

•getmodule(object):

还在为第2节中的__module__属性只返回字符串而遗憾吗?这个方法一定可以满足你,它返回object的定义所在的模块对象。

•get{file|sourcefile}(object):

获取object的定义所在的模块的文件名|源代码文件名(如果没有则返回None)。用于内建的对象(内建模块、类、函数、方法)上时会抛出TypeError异常。

•get{source|sourcelines}(object):

获取object的定义的源代码,以字符串|字符串列表返回。代码无法访问时会抛出IOError异常。只能用于module/class/function/method/code/frame/traceack对象。

•getargspec(func):

仅用于方法,获取方法声明的参数,返回元组,分别是(普通参数名的列表, *参数名, **参数名, 默认值元组)。如果没有值,将是空列表和3个None。如果是2.6以上版本,将返回一个命名元组(Named Tuple),即除了索引外还可以使用属性名访问元组中的元素。

  1. def add(x, y=1, *z):  
  2.     return x + y + sum(z)  
  3. print inspect.getargspec(add)  
  4. #ArgSpec(args=['x', 'y'], varargs='z'keywords=Nonedefaults=(1,))  

•getargvalues(frame):

仅用于栈帧,获取栈帧中保存的该次函数调用的参数值,返回元组,分别是(普通参数名的列表, *参数名, **参数名, 帧的locals())。如果是2.6以上版本,将返回一个命名元组(Named Tuple),即除了索引外还可以使用属性名访问元组中的元素。

  1. def add(x, y=1, *z):  
  2.     print inspect.getargvalues(inspect.currentframe())  
  3.     return x + y + sum(z)  
  4. add(2)  
  5. #ArgInfo(args=['x', 'y'], varargs='z'keywords=Nonelocals={'y': 1, 'x': 2, 'z': ()})  

•getcallargs(func[, *args][, **kwds]):

返回使用args和kwds调用该方法时各参数对应的值的字典。这个方法仅在2.7版本中才有。

•getmro(cls):

返回一个类型元组,查找类属性时按照这个元组中的顺序。如果是新式类,与cls.__mro__结果一样。但旧式类没有__mro__这个属性,直接使用这个属性会报异常,所以这个方法还是有它的价值的。

  1. print inspect.getmro(Cat)  
  2. #(<class '__main__.Cat'><type 'object'>)  
  3. print Cat.__mro__  
  4. #(<class '__main__.Cat'><type 'object'>)  
  5. class Dog: pass  
  6. print inspect.getmro(Dog)  
  7. #(<class __main__.Dog at 0x...>,)  
  8. print Dog.__mro__ # AttributeError  

•currentframe():

返回当前的栈帧对象。

其他的操作frame和traceback的函数请查阅inspect模块的文档,用的比较少,这里就不多介绍了。


评论关闭