用python下载gitbook上的pdf书籍后 如何转化为html,pythongitbook,如题,,,想把转化后的h


如题,,,

想把转化后的html丢进nginx中, 请问如何转为html。。。。。。。

你不如使用pdf.js直接在网页里加载PDF

直接weg下载gitbook目录不可么?

这个问题分两部分回答吧:

PDF 转 HTML;
PDF 和 HTML 结构差别极大,和epub比之HTML(epub只是HTML/XHTML的封装)

或者 Markdown 比之HTML(Markdown和HTML逻辑结构类似)有本质的区别。
目前有很多转换工具,可以用谷歌搜:PDF to HTML。需要注意的是,转换效果都不会很好

Gitbook上的PDF文档是由其它格式转换而来的(默认Markdown)。即 Markdown -> PDF;
所以你可以尝试获取该PDF的Markdown源码,再转换成HTML。

建议选择这条路。

有个第三方python库可以很轻松解决这个问题,这个是项目的托管地址

[https://github.com/coolwanglu...

它的具体用法在这里
https://github.com/coolwanglu...

http://app.xunjiepdf.com/pdf2...

楼主你是不是在一个Python-flask的群里。。昵称彼岸花开。。

编橙之家文章,

评论关闭