python处理小文件读写并行的一些疑惑,python读写,我有大量的小文件需要处理
python处理小文件读写并行的一些疑惑,python读写,我有大量的小文件需要处理
我有大量的小文件需要处理,采用那种并行方案比较好?
多进程
多线程
协程
我的疑惑在于:
Python的GIL的存在是否导致了多线程处理不如多进程处理?在耗时上
Python多进程的最佳进程数比如为4, 那么相同耗时的线程数是不是要比4高?
如果我在C中使用多线程,然后调用Python库,这种情形下有GIL的问题吗?
你的小文件是在同一磁盘上吗?你对每个小文件的「处理」是很快就能完成的操作吗?——如果不是,单线程单进程吧,瓶颈不在那里。
如果不确定,先单线程单进程,看 CPU 能跑满不。
写过多线程python处理小文件的程序大概4w多个html文件
印象里似乎多线程也没有怎么变快,甚至还慢了一点……推测下来是小文件的IO瓶颈太大而不是处理速度
你把这些小文件用BLOB写到一个NOSQL数据库里,然后来处理可能多线程上会有优势
大量小文件处理速度还是很快的,关键是磁盘的读写。
所以 1 2 3 效果不明显。
编橙之家文章,
相关内容
- python threading线程再次开启多线程AttributeError错误应对方
- WEB应用Python比PHP更适合吗,,我记得以前看过一篇文章,
- 贴个python源码求分析,微信第三方接口无法为客户端返回
- 提升Python编程能力有什么方法,提升python编程能力,我是
- 一个页面中的这两个信息能不用python无头浏览器爬取到
- Python菜鸟对类应用的问题求助,python菜鸟问题求助,cl
- Python如何实现点阵造字,python点阵造字,刚刚嵌入式老师
- 动态加载数据库再重新加载的问题url route,urlroute,把
- 请大牛帮看下我pymsyql插入数据的类型需要修改吗?,大
- pycharm启动单独py程序调试,怎么配置settings,pycharmpy,想单
评论关闭