HTMLページをキャプチャできるwkhtmltoimageのインストール手順(Amazon Linux編)

wkhtmltoimageというツールを利用すると、HTMLページをキャプチャしてJpeg画像として保存できます。

wkhtmltopdfのインストール

wkhtmltoimageはwkhtmltopdfに同梱されていますので、まず、wkhtmltopdfをインストールします。 インストール先のOSはAmazon EC2で稼働するOS「Amazon Linux」を想定しています。

$ mkdir /home/ec2-user/downloads
$ cd /home/ec2-user/downloads
$ sudo wget http://download.gna.org/wkhtmltopdf/0.12/0.12.2.1/wkhtmltox-0.12.2.1_linux-centos6-amd64.rpm
$ sudo yum install -y xorg-x11-fonts-75dpi
$ sudo rpm -ivh wkhtmltox-0.12.2.1_linux-centos6-amd64.rpm

日本語フォントのインストール

HTMLページをキャプチャする際に、日本語が文字化けしないように、日本語のフォントをインストールします。 ここでは、IPAのフォントをインストールしてみます。

$ cd /usr/share/fonts
$ sudo wget http://download.forest.impress.co.jp/pub/library/i/ipafont/10483/IPAfont00303.zip
$ sudo unzip IPAfont00303.zip
$ fc-cache -fv

以下のコマンドで、フォントがインストールされたことを確認できます。

$ fc-list | grep -i ipa
IPAゴシック,IPAGothic:style=Regular
IPA Pゴシック,IPAPGothic:style=Regular
IPA明朝,IPAMincho:style=Regular
IPA P明朝,IPAPMincho:style=Regular

関連ページ

wkhtmltoimageでHTMLページをJpeg画像として出力する