獲取網頁快照並生成縮略圖可分兩步進行:
1、獲取網頁快照
2、生成縮略圖
這裡我們用 phantomjs 來實現。關於 phantomjs 的詳細用法可參考官方網站。
我的環境是CentOS6.5,安裝時直接下載 tarball 然後解壓即可。
# wget https://bitbucket.org/ariya/phantomjs/downloads/phantomjs-1.9.8-linux-i686.tar.bz2 # tar -jxvf phantomjs-1.9.8-linux-i686.tar.bz2 # cp phantomjs-1.9.8-linux-i686/bin/phantomjs /bin/phantomjs
第二步中解壓後bin目錄下的 phantomjs 二進制文件即是可調用命令。
第三步是為了在以後調用命令時不必輸入命令全路徑。
phantomjs的調用需要一個js腳本。這個js腳本接收兩個參數,分別是網址url和快照文件名稱filename,腳本snap.js內容如下:
/*
* desc: get snapshot from url
* author: 十年後的盧哥哥(http://www.linuxidc.com)
* example: phantomjs snap.js http://www.baidu.com baidu.png
*/
var page = require('webpage').create();
var args = require('system').args;
var pageW = 1024;
var pageH = 768;
page.viewportSize = {
width: pageW,
height: pageH
};
var url = args[1];
var filename = args[2];
page.open(url, function (status) {
if (status !== 'success') {
console.log('Unable to load ' + url + ' !');
phantom.exit();
} else {
window.setTimeout(function () {
page.clipRect = { left: 0, top: 0, width: pageW, height: pageH };
page.render(filename);
console.log('finish:', filename);
phantom.exit();
}, 1000);
}
});
在這個腳本中還有個小小的設置,就是設置打開頁面的浏覽器可視區域的大小為1024*768,然後取第一屏內容。
調用命令如下:
phantomjs snap.js http://www.baidu.com baidu.png
注意:這裡執行命令的用戶需要對目錄有寫權限。
獲取的截圖如下:
生成縮略圖用的是ImageMagick工具,ImageMagick是個非常強大的圖片處理工具,可對圖片進行轉化(格式轉換、縮放、剪切、模糊、反轉等)、屏幕截圖、圖片顯示等,詳細用法可參考 我的ImageMagick使用心得 一文。
RedHat系列可使用yum安裝:
# yum install ImageMagick ImageMagick-devel
其他平台安裝請參考官方網站:http://www.imagemagick.org/script/binary-releases.php,根據你的系統選擇相應的包或自己編譯源碼。
我們這裡只使用圖片縮放工具,語法為:
convert -resize 320x240 baidu.png baidu_thumbnail.png
默認是按比率縮放,如果要強制縮放,可以在尺寸後面加感歎號:
convert -resize 320x240! baidu.png baidu_thumbnail.png
生成的縮略圖如下:
如果希望將上兩步自動化,可以寫一個shell腳本實現:
# !/bin/bash
# desc: create snapshot from url
# autor: 十年後的盧哥哥(http://www.linuxidc.com)
# example: sh createsnap.sh http://www.baidu.com baidu
URL=$1
IMAGE_NAME=$2
SNAPSHOT_NAME="${IMAGE_NAME}.png"
THUMBNAIL_NAME="${IMAGE_NAME}_thumbnail.png"
phantomjs snap.js $URL $SNAPSHOT_NAME
convert -resize 320x240 $SNAPSHOT_NAME $THUMBNAIL_NAME
exit 0
1、http://phantomjs.org/
2、http://www.imagemagick.org/