原因
rsync具体的增量同步算法不太清楚。根据它的表现来看,可能在增量同步已经存在的一个文件时,会校验已传输部分数据是否已源文件一致,校验完成才继续增量同步这个文件剩下的数据。所以如果对一个大文件以这样的算法来增量同步是非常花时间并且占用IO资源的。
方法
rsync有一个参数能快速恢复大文件的增量同步,--append。
设置–append参数会在增量同步时计算文件 大小并直接追加新的数据到文件,这样就省了费IO校验的过程。
注意:这个参数最好只在源文件和目标文件都不会更改的时候使用比较安全,比如备份的文件。
案例:
test-2019-06目录下为150G的压缩文件,因网络带宽问题,设置定时任务,每天正常情况下,只能同步10G左右数据
rsync -vzrtp -P --append --bwlimit=1024 -e "/usr/bin/ssh -p 22 -o StrictHostKeyChecking=no" root@192.168.1.100:/tmp/test-2019-06 /tmp/backup
参数详解:
-v --verbose 详细模式输出
-z, --compress 对备份的文件在传输时进行压缩处理
-t, --times 保持文件时间信息
-r, --recursive 对子目录以递归模式处理
-p, --perms 保持文件权限
-P, --partial 保留那些因故没有完全传输的文件,以是加快随后的再次传输
--bwlimit=KBPS 限制I/O带宽,KBytes per second
原文:https://blog.51cto.com/bjdongpengfei/2420739