首页 > 其他 > 详细

wvs爬虫 目录和文件提取 导出

时间:2015-11-16 19:05:39      阅读:285      评论:0      收藏:0      [点我收藏+]
 1 #!/bin/sh
 2 
 3 fileName=$1
 4 cat ${fileName}|grep http://|awk -F URL> {print $2}>file.txt
 5 ##url为目录+文件的列表
 6 awk -F </ {print $1} file.txt>url.txt
 7 ##输出以/结尾的url,其中,\/$代表以/结尾的行,\用于转义。
 8 awk /\/$/ url.txt >dir.txt
 9 ##!代表取反,输出不以/结尾的行,即文件列表
10 awk !/\/$/ url.txt >file.txt
11 echo "resultfiles are in currentdir url.txt dir.txt file.txt"

 

wvs爬虫 目录和文件提取 导出

原文:http://www.cnblogs.com/changddcn/p/4969628.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!