html转换为pdf

将html转换为pdf的工具有两个:phantomjs和wkhtmltopdf,下面分别对两个工具进行介绍。

phantomjs

phantomjs不仅仅只是一个html2pdf的工具,这个是一个Headless WebKit(现在chrome也支持这种模式运行了),可以用来写前端测试等一系列的功能(可惜的是该项目已经停止维护了,项目地址:https://github.com/ariya/phantomjs)。回到主题,phantomjs使用简单,可以自己编写相关测输出脚本,运行的cmd:phantomjs.exe rasterize.js http://www.oschina.net/ test.pdf "A4",可以参考该项目的官方网址:https://phantomjs.org/,比较可惜的是,该项目在window下生成的pdf是很完美的,但是linux下生成的pdf文件就比较糟糕了,主要是dpi惹的祸,直到项目停止维护,该问题都没有解决。为了解决linux下可以完美渲染,在网上查找了很多资料,最终发现phantomjs的pdf生成功能依赖于另一个项目wkhtmltopdf。

wkhtmltopdf

该项目是一个将html转化为pdf的项目,项目地址:https://github.com/wkhtmltopdf/wkhtmltopdf,该工具生成pdf非常简单,cmd:wkhtmltopdf {url} {file} 该工具可以解决linux下生成pdf 的dpi的问题。
需要注意的是,在linux下生成生成pdf很由可能会产生乱码的问题,主要是linux服务器上缺少字体。可以将window的字体copy到linux的/var/share/fonts文件夹下面然后刷新字体。

//copy fontcd /usr/share/fonts/mkfontscalemkfontdirfc-cachefc-list :lang=zh

准备工作做完后就可以使用工具将html转换为pdf了。

ps:wkhtmltopdf比较坑的是,里面有许多的默认选项是开启的会导致一些无法想象的结果,本人就遇到过--enable-smart-shrinking(默认)导致生成出来的pdf完全走样的问题。wkhtmltopdf相对于高速发展的互联网,一些新的技术都没有很好的支持,制作生成的html页面时,还是使用比较基础的技术,尽量使用支持比较完整的规范,减少后面会踩的坑

ps: chrome也提供了headless模式,该模式下也可以进行pdf的生成,

相关文章