用python下载gitbook上的pdf书籍后如何转化为html，pythongitbook,如题，，，想把转化后的h

文章由Byrx.net分享于2019-03-23 05:03:57评论（616）

用python下载gitbook上的pdf书籍后如何转化为html，pythongitbook,如题，，，想把转化后的h

如题，，，

想把转化后的html丢进nginx中， 请问如何转为html。。。。。。。

你不如使用pdf.js直接在网页里加载PDF
直接weg下载gitbook目录不可么？
这个问题分两部分回答吧：
PDF 转 HTML；
PDF 和 HTML 结构差别极大，和epub比之HTML（epub只是HTML/XHTML的封装）
或者 Markdown 比之HTML（Markdown和HTML逻辑结构类似）有本质的区别。
目前有很多转换工具，可以用谷歌搜：PDF to HTML。需要注意的是，转换效果都不会很好。
Gitbook上的PDF文档是由其它格式转换而来的(默认Markdown)。即 Markdown -> PDF；
所以你可以尝试获取该PDF的Markdown源码，再转换成HTML。
建议选择这条路。
有个第三方python库可以很轻松解决这个问题，这个是项目的托管地址
[https://github.com/coolwanglu...
它的具体用法在这里
https://github.com/coolwanglu...
http://app.xunjiepdf.com/pdf2...
楼主你是不是在一个Python-flask的群里。。昵称彼岸花开。。

编橙之家文章，

热门文章：

用python下载gitbook上的pdf书籍后如何转化为html，pythongitbook,如题，，，想把转化后的h