pandoc使用指南,markdown转html

什么是pandoc?

pandoc的官方描述是“通用文档格式转换器”,意味着你可以通过它实现多种格式文档的互相转换。转换动作包含两个角色,源头和目标。有些文档格式只能作为源头(设为A类),有些格式只能作为目标(设为B类),还有的是即可作为源头也可作为目标(设为C类)。具体支持的格式我就不多做赘述,例如markdown格式为C类,pdf为B类,csv为A类,更详细信息大家可以参考官网首页格式转换图

安装pandoc

pandoc的windows安装文件部署在github,网速不好的同学可能无法访问或者下载缓慢。我在阿里云盘存了一份,提取码im62 。安装后任意打开dos或者powershell命令行运行pandoc –version,如果输出正确版本号,意味着你已经安装成功,可以进行下一步了。

markdown转html再转pdf

假设d:盘下有一份markdown简历my_resume.md,建立my_resume.md可以参考建立自己的markdown简历,在dos或者powershell中执行下面的命令

1
C:\>pandoc D:\my_resume.md -o D:\resume.html

执行成功在d盘就可以看到生成的resume.html。火狐浏览器打开resume.html,可能是乱码,用记事本打开resume.html,然后在第一行加入如下代码即可修复

1
<head><meta charset="utf-8"></head>

生成的html页面可以通过火狐浏览器、谷歌浏览器打开,找到浏览器的打印按钮(快捷键Ctrl + P),目标打印机选择“另存为pdf”,更多选项里不选择页眉和页脚就没有影响美观的其他信息,这样一个简洁美观的pdf简历也出来了。html的版本我们还可以在互联网上部署。

markdown转docx

很简单,和上面一样即可

1
C:\>pandoc D:\my_resume.md -o D:\resume.docx

docx转pdf简单方法

如何你已经安装microsoft office办公软件,直接点击另存为,选择保存类型为pdf即可。而金山wps却因为word转pdf功能而向我们收费,在我看来完全不值得。另外libreoffice是一款自由免费的办公软件,默认使用开放文档格式 (OpenDocument Format,ODF),但也支持docx/xlsx/pptx等其他格式。比起microsoft office和wps显然自由很多,卸载安装随心控制。libreoffice打开docx格式文档后,点击导出为pdf即完成转换。

使用pandoc生成pdf

利用pandoc生成pdf是个费劲的事情,可以简要介绍一下,感兴趣的可以参考一下,准备工作如下

  1. 安装pandoc
  2. 下载Tex live ISO(5GB大小使用清华镜像站很快)
  3. 下载完成后双击ISO,它会映射为系统的一个磁盘,可能是E盘或者其他,不过你可以找到它
  4. 运行命令1,安装Tex live(大概花费30-40分钟)
  5. 运行命令2,使用pandoc将格式转换到pdf

命令1

1
2
C:\>E:
E:\>install-tl-windows.bat -gui

命令2

1
C:\>pandoc D:\resume.docx --pdf-engine xelatex --CJKmainfont "Microsoft YaHei" -o D:\resume.pdf