频道导航

CURL版递归爬虫下载软件脚本

2020-04-08 Shell 前端之家

前端之家收集整理的这篇文章主要介绍了CURL版递归爬虫下载软件脚本，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

下面是编程之家 jb51.cc 通过网络收集整理的代码片段。

编程之家小编现在分享给大家，也给大家做个参考。

#!/bin/env bash
PATH=/bin:/sbin:/usr/bin:/usr/sbin:/usr/local/bin:/usr/local/sbin
export PATH
clear
Url="http://mirrors.cnnic.cn/apache/"
DownListFile="/tmp/downlist.txt"
DownListTmpFile="/tmp/tmplist.txt"
DownFileType="zip$|gz$"
DownList=""
UrlBack="$Url"
[ ! -f $DownListFile ] && touch $DownListFile || echo > $DownListFile
[ ! -f $DownListTmpFile ] && touch $DownListTmpFile || echo > $DownListTmpFile
CURL_URLS(){
	Urls=`curl $UrlBack |awk -F "a href=\"" '{printf "%s\n",$2}'|awk -F "\"" '{printf "%s\n",$1}'|grep -vE "^$|^\?|^http:\/\/"|^#`
}
URL_LIST(){
	CURL_URLS
	for i in $Urls ;do
		echo "$UrlBack$i" >> $DownListTmpFile
	done
}
RECURSIVE_SEARCH_URL(){
	UrlBackTmps=`cat $DownListTmpFile`
	[[ "$UrlBackTmps" == "" ]] && echo "no more page for search" && exit 1
	for j in $UrlBackTmps ;do
		if [[ "${j##*\/}" != "" ]] ;then
			echo "$j" >> $DownListFile
		else
			UrlBack="$j"
			URL_LIST
		fi
		UrlTmps=`grep -vE "$j$" $DownListTmpFile`
		echo "$UrlTmps" > $DownListTmpFile
		RECURSIVE_SEARCH_URL
	done
}
DOWNLOAD_FILE(){
	DownList=`grep -E "$DownFileType" $DownListFile`
	for k in $DownList ;do
		FilePath=/tmp/${k#*\/\/}
		[ ! -d `dirname $FilePath` ] && mkdir -p `dirname $FilePath`
		[ ! -f $FilePath ] && cd `dirname $FilePath` && curl -O $k
	done
}
URL_LIST $Urls
RECURSIVE_SEARCH_URL

以上是编程之家(jb51.cc)为你收集整理的全部代码内容，希望文章能够帮你解决所遇到的程序开发问题。

如果觉得编程之家网站内容还不错，欢迎将编程之家网站推荐给程序员好友。

上一篇：Ubuntu 10.10更新源列表及更新方法下一篇：Powershell并行循环

猜你在找的Shell相关文章

shell 变量的定义，赋值，运算

一、变量类型 1.1、自定义变量 1.定义变量 2.引用变量 3.查看变量值 4.取消变量 5.作⽤用范...

作者：前端之家时间：2021-02-22

shell 变量删除与替换

1、从左往右删除匹配内容 2、从右往左删除匹配内容 3、切片 4、变量内容替换 5、变量替代 ...

作者：前端之家时间：2021-02-22

bash常用功能

1、历史命令 2、历史命令使用使用上、下箭头调用以前的历史命令使用“!n”重复执行第 n ...

作者：前端之家时间：2021-02-22

shell 循环语句

1、 shell中的循环语句循环语句，主要是为了简化重复动作代码，在运维方面主要用于重复某...

作者：前端之家时间：2021-02-22

shell 条件测试

1、文件相关 1.1命令行使用 1.2脚本中使用，一般配合条件控制语句使用。 [root@localhost ...

作者：前端之家时间：2021-02-22

Shell 入门教程（二十）：关系运算符的使用

有时候我们需要比较两个数字的大小关系，这时候就要用到关系运算符。关系运算符只支持数值...

作者：前端之家时间：2021-02-01

Shell 入门教程（十六）：如何进行文件判断

文件测试运算符用于检测文件的各种状态和属性，目前支持的运算符如下： -b file：是否块设...

作者：前端之家时间：2021-02-01

Shell 快速入门（零）：目录

文章首发于【陈树义】公众号，点击跳转到原文：https://www.cnblogs.com/chanshuyi/p/quic...

作者：前端之家时间：2021-02-01

Shell 入门教程（三）：文件结构

文章首发于【陈树义的博客园】，点击跳转到原文：https://www.cnblogs.com/chanshuyi/p/qu...

作者：前端之家时间：2021-02-01

Shell 入门教程（十）：如何进行数值比较

文章首发于【陈树义的博客园】，点击跳转到原文：https://www.cnblogs.com/chanshuyi/p/qu...

作者：前端之家时间：2021-02-01

编程分类

Linux Windows CentOS Ubuntu Nginx WebService Scala Memcache Apache Redis Docker Bash Azure Tomcat LNMP Shell 数据结构服务器运维网络安全

最新文章