求Python读取大数据量XML文件优化方案,pythonxml,我用 minidom 写


我用 minidom 写了个读取 XML 的函数,读取一个几KB的小文件没问题;
当读取一个近 10M 的文件时(两个文件内容格式一样)报错:

File "C:\Python27\lib\xml\sax\handler.py", line 38, in fatalErrorraise exceptionxml.sax._exceptions.SAXParseException: <unknown>:762:4: mismatched tag

目测是因为文件太大的缘故。
问:
1. 是因为文件太大吗?该如何解决?
2. 有没有读取大 XML 文件(>10M)的方案?(限 Python 语言)

有教程教你如何使用 Python 的 lxml 库处理上 G 的 XML 文件。

编橙之家文章,

评论关闭