動的なブラウザタイプのクローラーを作成する為、PhantomJSのインストールをした時の手順です。
見出し
CentOSへのPhantomJSのインストール
以下のディレクトリに移動
1 |
# cd /usr/local/src/ |
wgetでPhantomJSのダウンロード
自分はlinux 64だったので以下のURLですが、それ以外の環境は公式に載っています。
http://phantomjs.org/download.html
1 |
# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-2.1.1-linux-x86_64.tar.bz2 |
PhantomJSの解凍
1 |
# tar jxfv phantomjs-2.1.1-linux-x86_64.tar.bz2 |
PhantomJSのコピー
1 |
# cp -pr phantomjs-2.1.1-linux-x86_64.tar.bz2/bin/phantomjs /usr/bin/ |
PhantomJSのインストール確認
1 2 |
[user@localhost ~]$ phantomjs phantomjs> |
WindowsへのPhantomJSのインストール
ここまでやって気づいたのですが自分はWindowsへインストールする必要がありました。Windowsのブラウザでクローリングしたいからです。
PhantomJSのダウンロード
windowsを選びました。
http://phantomjs.org/download.html
PATH設定
コントロールパネル>システム>システムのプロパティ>環境変数>ユーザ環境変数PATHにダウンロードして適当なフォルダ(例.C:\Program Files (x86)\phantomjs\bin)に移動したパスを追記。セミコロン(;)区切りになっているので注意。exeがあるディレクトリまで指定する。
PhantomJSのインストール確認
1 2 |
C:\Users\test>phantomjs phantomjs> |
その他
使い方などはまた記録します。以下の作業時に使用しています。
データベース系サイト用にデータ収集クローラーを開発してみることにしました。その記録をこちらに記載していきます。
この記事は随時追記して...