python 处理pdf加密文件,网上没有搜到相关的p
python 处理pdf加密文件,网上没有搜到相关的p
近期有同事需要提取加密的pdf文件,截取其中的信息,并且重构pdf文件。网上没有搜到相关的pdf操作,于是咨询了chatgpt,给出了pypdf2的使用案例。但是时间比较久远了,很多库内的调用接口都已经更新了。
于是自行到官方的库内学习相关接口使用。整理的处理代码如下:
# -*- coding: utf-8 -*- """ Created on Thu Jan 11 10:36:17 2024 @author: xm AZHE """ import PyPDF2 file=r'C:\Users\xm\Downloads\xxx1.pdf' # 打开PDF文件 pdf_file = open(file, 'rb') # 创建一个PDF阅读器对象 pdf_reader = PyPDF2.PdfReader(pdf_file) # 创建一个新的PDF写入器对象 pdf_writer = PyPDF2.PdfWriter() # 截取第0,第101到108页 page = pdf_reader.pages[0] pdf_writer.add_page(page) for i in range(101,109): page = pdf_reader.pages[i] pdf_writer.add_page(page) # 顺便导出下每页的图片 count = 0 for image_file_object in page.images: with open(str(count) + image_file_object.name, "wb") as fp: fp.write(image_file_object.data) count += 1 # 打印下下每页的文字 page.extract_text(0) # 处理的文件加个密 pdf_writer.encrypt("123456") # 创建一个新的PDF文件并将页面写入其中 out_file=file.replace('.pdf','_remake.pdf') output_file = open(out_file, 'wb') pdf_writer.write(output_file) # 关闭文件 output_file.close() pdf_file.close()
PS: 解密用
if reader.is_encrypted: reader.decrypt("123456")
——————————————活在当下,首先就是要做好当下的事.
相关内容
- Python手相识别教程4手指,手指的形状、长度和相
- 用Python写的自动答题脚本,正确率99%,刷课必备,驱动
- 【Python】【OpenCV】OCR识别(三)——字符识别,我们使
- Python手相识别教程3手的纹理、灵活性、一致性、颜色和
- 这些常见的python编码习惯,你都会吗,简介语言在发展
- python中的json操作总结,用法例如d='{"a
- Python教程(21)——面向对象编程的三大特性,Python被称为
- 【python可视化大屏】使用python实现可拖拽数据可视化大
- 在Python中利用内置SQLite3模块进行数据库操作的完整指南
- Python 学习笔记(二十)--Django REST Framework之认证,sel
评论关闭