清理用浏览器保存的网页资源,浏览器资源,一般我们用浏览器将网页保


一般我们用浏览器将网页保存下来时会产生两个文件:即 ".html"或".htm"和"*_files"文件夹。如果只要提取网页中的资源(比如图片),只需保留"???_files"文件夹,而"html"文件对于我们来说是没用的。

本程序的功能就是删除一个目录中所有的".html"或".htm"文件,并将"???_files"文件夹重命名为"???"。

# -*- coding: gb18030 -*-# by whypro# 2012-09-02import osdef clean_files(path):    for file_name in os.listdir(path):        full_name = os.path.join(path, file_name)        # 如果是目录        if os.path.isdir(full_name):            # 目录重命名            pos = file_name.find('_files')            if pos > 0:                                new_name = file_name[:pos]                os.rename(full_name, os.path.join(path, new_name))                print '%s --> %s' % (file_name, new_name)            else:                print '%s has skipped.' % file_name        elif os.path.isfile(full_name):            if (file_name.find('.html') > 0) or (file_name.find('htm')) > 0:                os.remove(full_name)                print '%s has removed.' % file_name            else:                print '%s has skipped.' % file_nameclean_files('C:\\\\文件夹')#该片段来自于http://byrx.net

评论关闭