python多线程不能利用多核cpu,但有时候多线程确实比单线程快。,,python 为什么


python 为什么不能利用多核CPU

GIL其实是因为在python中有一个GIL(Global Interpreter Lock),中文为:全局解释器锁。

1、最开始时候设计GIL是为了数据安全
python为了数据安全设计了这个GIL。
2、每个CPU在同一时间只能执行一个线程:
(在单核CPU下的多线程其实都只是并发,不是并行,并发和并行从宏观上来讲都是同时处理多路请求的概念。但并发和并行又有区别,并行是指两个或者多个事件在同一时刻发生;而并发是指两个或多个事件在同一时间间隔内发生(
2)在python多线程下,每个线程的执行方式如下:
1、获取GIL

2、执行代码直到sleep或者是python虚拟机将其挂起。
3、释放GIL

为什么有时候多线程效率低于单线程?


1、如上我们可以知道,在python中想要某个线程要执行必须先拿到
GIL这把锁,且python只有一个GIL,拿到这个GIL才能进入CPU执行,
在遇到
I/O 操作时会释放这把锁。如果是纯计算的程序,没有I/O 操作,解释器会每隔
100次操作就释放这把锁,让别的线程有机会执行(这个次数可以通sys.setcheckinterval
来调整)。所以虽然CPython 的线程库直接封装操作系统的原生线程,但CPython
进程做为一个整体,同一时间只会有一个获得了
GIL 的线程在跑,其它的线程都处于等待状态等着
GIL 的释放。
2、而每次释放GIL锁,线程进行锁竞争、切换线程,会消耗资源。并且由于
GIL锁存在,python里一个进程永远只能同时执行一个线程(拿到GIL的线程才能执行
),这就是为什么在多核
CPU上,python的多线程效率并不高。


python
的多线程是否就完全没有用了呢?

相同的代码,为何有时候多线程会比单线程慢,有时又会比单线程快?
这主要跟运行的代码有关:
1、CPU密集型代码
(各种循环处理、计数等等),在这种情况下,由于计算工作多,ticks计数很快就会达到
100阈值,然后触发GIL的释放与再竞争(多个线程来回切换当然是需要消耗资源的),所以python下的多线程遇到CPU密集型代码时,单线程比多线程效率高。
IO密集型代码(文件处理、网络爬虫等),多线程能够有效提升效率
(单线程下有IO操作会进行IO等待,造成不必要的时间浪费,而开启多线程能在
线程
A等待时,自动切换到线程
B,可以不浪费
CPU的资源,从而能提升程序执行效率
)。

进行IO密集型的时候可以进行分时切换 所有这个时候多线程快过单线程(
5)如果python想充分利用多核CPU,可以采用多进程,每个进程有各自独立的
GIL,互不干扰,这样就可以真正意义上的并行执行,所以在
python中,多进程的执行效率优于多线程
(仅仅针对多核CPU而言)。
所以在多核CPU下,想做并行提升效率,比较通用的方法是使用多进程,能够有效提高执行效率。

python多线程不能利用多核cpu,但有时候多线程确实比单线程快。

评论关闭