如何创新Python虚拟机线程


一些开发人员明确指示Python虚拟机创建新的线程,Python就能意识到用户需要多线程的支持,如果没有前期的这些支持,不知道Python虚拟机能不能顺利的发展下去。

Python虚拟机的thread module所提供的接口中,一定不能少的肯定是创建线程的接口,倘若没有这个接口,生活还有什么意义呢J?在上面的thread1.py中,我们正是通过其提供的start_new_thread创建了一个崭新的线程。好,我们就进入这个start_new_ thread,看看Python是如何进行创世纪的工作的:

  1. [thread_nt.h]  
  2.  
  3. int PyThread_acquire_lock(PyThread_type_lock aLock, int waitflag)  
  4.  
  5. {  
  6.  
  7.     int success ;  
  8.  
  9.     success = aLock && EnterNonRecursiveMutex((PNRMUTEX) aLock, (waitflag 
  10.  
  11.        == 1 ? INFINITE : 0)) == WAIT_OBJECT_0 ;  
  12.  
  13.     return success;  
  14.  
  15. }  
  16.  
  17. DWORD EnterNonRecursiveMutex(PNRMUTEX mutex, BOOL wait)  
  18.  
  19. {  
  20.  
  21.     /* Assume that the thread waits successfully */  
  22.  
  23.     DWORD ret;  
  24.  
  25.     /* InterlockedIncrement(&mutex->owned) == 0 means that no thread  
  26.  
  27.         currently owns the mutex */  
  28.  
  29.     if (!wait)  
  30.  
  31.     {  
  32.  
  33.         if (InterlockedCompareExchange((PVOID *)&mutex->owned, (PVOID)0,  
  34.  
  35.               (PVOID)-1) != (PVOID)-1)  
  36.  
  37.             return WAIT_TIMEOUT ;  
  38.  
  39.         ret = WAIT_OBJECT_0 ;  
  40.  
  41.     }  
  42.  
  43.     else  
  44.  
  45.         ret = InterlockedIncrement(&mutex->owned) ?  
  46.  
  47.             /* Some thread owns the mutex, let's wait... */  
  48.  
  49.             WaitForSingleObject(mutex->hevent, INFINITE) : WAIT_OBJECT_0 ;  
  50.  
  51.     mutex->thread_id = GetCurrentThreadId() ; /* We own it */  
  52.  
  53.     return ret ;  
  54.  
  55. }  

在代码清单中,我们注意到boot->interp中保存了Python的PyInter- preterState对象,这个对象中携带了Python的module pool这样的全局信息,Python中所有的thread都会共享这些全局信息。

关于代码清单15-1的[2]处所示的多线程环境的初始化动作,有一点需要特别说明,当Python启动时,是并不支持多线程的。换句话说,Python中支持多线程的数据结构以及GIL都是没有创建的,Python之所以有这种行为是因为大多数的Python程序都不需要多线程的支持。

假如一个简单地统计词频的Python脚本中居然出现了多线程,面对这样的代码,我们一定都会抓狂的J。
对多线程的支持并非是没有代价的。最简单的一点,如果激活多线程机制,而执行的Python程序中并没有多线程,那么在100条指令之后,Python虚拟机同样会激活线程的调度。

而如果不激活多线程,Python虚拟机则不用做这些无用功。所以Python选择了让用户激活多线程机制的策略。在Python虚拟机启动时,多线程机制并没有被激活,它只支持单线程,一旦用户调用thread.start_new_thread。

明确指示Python虚拟机创建新的线程,Python就能意识到用户需要多线程的支持,这个时候,Python虚拟机会自动建立多线程机制需要的数据结构、环境以及那个至关重要的GIL。

在这里,我们终于看到了Python中多线程机制的平台相关性,在Python25\Python目录下,有一大批thread_***.h这样的文件。这些文件中,包装了不同操作系统的原生线程,并通过统一的接口暴露给Python,比如这里的PyThread_allocate_lock就是这样一个接口。

我们这里的thread_nt.h中包装的是Win32平台的原生thread,在本章中后面的代码剖析中,还会有大量与平台相关的代码,我们都以Win32平台为例。在PyThread_allocate_lock中,与PyEval_InitThreads非常类似的,它会检查一个initialized的变量,如果说GIL指示着Python的多线程环境是否已经建立。

那么这个initialized变量就指示着为了使用底层平台所提供的原生thread,必须的初始化动作是否完成。这些必须的初始化动作通常都是底层操作系统所提供的API,不同的操作系统可能需要不同的初始化动作。

  1. 有关Python系统文件进行介绍指导
  2. 如何正确的使用Python函数
  3. Python 构建工具进行详细介绍分析
  4. PythonAndroid浅析Python优势所在
  5. 如何使用Python模块解析配置文件?

相关内容

    暂无相关文章

评论关闭