用 Python 快速找到最大的文件,


现在的电脑差不多都是固态硬盘了,速度很快,但容量不会太大,经常会出现磁盘空间不足的情况,怎么办,删除那些不重要的最大的文件是最有效的办法。

那么如何用找到最大的文件呢?比如说找到最大的前 10 个文件?

思路:我们遍历目录,将文件路径和文件大小作为生成器返回,然后插入大小为 10 的大顶堆,最后将大顶堆的内容打印即可。

借助 Python,代码很简洁:

  1. import os 
  2. import time 
  3.  
  4. from os.path import join, getsize 
  5. from heapq import nlargest 
  6.  
  7.  
  8. def walk_files_and_sizes(start_at: str): 
  9.     for root, _, files in os.walk(start_at): 
  10.         for file in files: 
  11.             path = join(root, file) 
  12.             try: 
  13.                 size = getsize(path)  # bytes 
  14.                 yield path, size 
  15.             except OSError: 
  16.                 continue 
  17.  
  18.  
  19. def largest_files(n: int, start_at: str) -> None: 
  20.     MB = 1024 * 1024 
  21.     largest = nlargest(n, walk_files_and_sizes(start_at), key=lambda x: x[1]) 
  22.  
  23.     for path, size in largest: 
  24.         print(f'{size//MB} MB {path}') 
  25.  
  26.  
  27.  
  28. if __name__ == '__main__': 
  29.     start = time.perf_counter() 
  30.     largest_files(10, "/Users/aaron/") 
  31.     elapsed = time.perf_counter() - start 
  32.     print(f'{elapsed} seconds elapsed') 

我在自己电脑上跑了下,200 GB 左右的目录,123 秒就跑完了:

接下来删除不需要的文件就可以了。

如果是 Windows 系统也是可以的:

  1. largest_files(10, "C:/Users/xxx/") 

最后的话

本文的方法非常实用,可以收藏,说不定那天,这个小工具就帮你解决了大问题。

评论关闭