最近團隊正在開發一個版本對比工具,要求是把A1文件夾與A2對比,將A2中的增量部分,輸出到update文件夾中,生成增量升級包/差分包。
實現該功能的第一反應是,分別遍歷2個文件夾,進行單個文件對比是否存在於MD5比對,並輸出結果,但是這個絕對是最低級做法,並且時間復雜度為O(n²),基本上就是直接否定。
後來深入研究了內核補丁常用的diff + patch方案,即
diff -urNa dir1 dir2
生成了差異文件後,用patch命令進行文件的復制或者文件內容修改。這個很明顯如果要實現需求還是要去人工代碼解析diff的結果才行。也是復雜了。
突然。。或者是說類似動畫片裡面柯南那句masaka 搭配場景閃現的效果出現了...
能分析出文件夾差異,還能支持多種對比模式checksum、mod-time、size的,還能過濾掉svn不需要提交的二進制文件、中間文件,經常用於服務器端增量同步的,不就是rsync麼。。。(該處rsync應該字號放大十倍,但是markdown改不了)
現在唯一要解決的問題是,rsync是從A文件夾同步到B文件夾,是否可以重定向這個同步的文件到C文件夾而不改變B文件夾內容呢?
翻看了rsync man之後oh ~ 這個--dry-run參數是演示trial的意思。。也就是說使用了dry-run就只能看,不會變了。。。
馬上開始coding。。。
A1.1是新文件夾,A1.0是舊文件夾,out是放置 A1.0到A1.1的保持目錄結構的增量文件。
rsync --dry-run -rcnC --out-format="%n" A1.1/ A1.0/
注意該處的-C參數是按照cvs的ignore規則來過濾不需要同步的文件,在CVS中,默認是不會提交二進制文件的,所以如果需要進行二進制文件提取,那就不要加C.
執行了該命令後,得到了一個A1目錄的文件列表:
A1.1/system/app/
A1.1/system/app/A.apk
A1.1/system/app/B.apk
A1.1/system/app/C.apk
也就是差異文件,由於這裡默認會顯示出文件夾,所以要過濾掉以『/』結尾的文件夾的顯示
rsync --dry-run -rcnC --out-format="%n" A1.1/ A1.0/ |grep -v "/$"
這樣就得到了一個純增量文件的列表
有了文件列表,復制的操作方法就很多了。可以繼續使用rsync同步到新的out目錄,以防止多次執行後錯誤文件修復問題
完整代碼
rsync --dry-run -rcnC --out-format="%n" A1.1/ A1.0/ |grep -v "/$"|xargs -I{} rsync -R A1/./{} out/
搞定!
其實我們身邊有很多常用的工具,具備強大的功能。其實作為程序猿這個群體,『浮躁』是一個界限將高手與菜鳥分開。其實高手並不是掌握了多少語言,懂了多少模式、收藏了多少的開源代碼工具...
而是需要踏踏實實走好每一步。
RSync實現文件備份同步詳解 http://www.linuxidc.com/Linux/2014-09/106967.htm
利用inotifywait監控主機文件和目錄 http://www.linuxidc.com/Linux/2013-03/81075.htm
利用inotify+rsync實現Linux文件批量更新 http://www.linuxidc.com/Linux/2012-01/52132.htm
inotify-tools+rsync實時同步文件安裝和配置 http://www.linuxidc.com/Linux/2012-06/63624.htm
rsync同步完整配置 http://www.linuxidc.com/Linux/2013-06/85781.htm
CentOS 6.5下Rsync遠程同步 http://www.linuxidc.com/Linux/2014-05/101084.htm
Rsync 的詳細介紹:請點這裡
Rsync 的下載地址:請點這裡