https://github.com/coolwanglu/pdf2htmlEX
PDFファイルをHTMLに変換することができます。
Ubuntu 12.04へのインストール方法は
$ sudo add-apt-repository ppa:coolwanglu/pdf2htmlex $ sudo apt-get update && sudo apt-get upgrade $ sudo apt-get install pdf2htmlexpdftohtmlコマンドよりも造形を忠実に再現してくれますが、日本語が変になる場合もあるようです。PDFで使われているフォントの問題?$ pdf2htmlEX hoge.pdf
【参考】
・これがHTML?と言いたくなるようなPDF変換ソフトウェア「pdf2htmlEX」 - MOONGIFT
・pdf2htmlEX - TeX Wiki
12:36 am | コメントする |
1. luwang (Website) 2012/10/27 23:31
問題があったPDFファイルを送信してくれませんか、修正するためです。
ありがとうございます。
2.
Sawa 2012/10/31 00:56
https://github.com/coolwanglu/pdf2htmlEX/issues/43
フォントが原因ではなく、「縦書き」が原因でした。