vbs 函数过程:
1. 调用wget: 下载网站所有页面到本脚本目录 ……
2. 扫描本脚本目录中所有文件 ……
3. 读取本脚本目录中的所有网页,匹配图片 URL 地址 ……
4. 保存所有图片 URL 地址到 url-img.txt 文件 ……
5. 调用wget: 下载 url-img.txt 指定的图片到本脚本 img 目录 ……
' wget_img.vbs Call Main() Sub Main() ' CMD 模式 If Not (LCase(Right(WScript.FullName,11)) = LCase("CScript.exe")) Then CreateObject("WScript.Shell").Run "cscript.exe //nologo """ & WScript.ScriptFullName & """", 1, False WScript.Quit(1) End If Dim wso, strMeDir Set wso = WScript.CreateObject("WScript.Shell") strMeDir = Left(WScript.ScriptFullName, InStrRev(WScript.ScriptFullName,"\")-1) ' 启动 wget下载网站所有页面到本脚本目录的 720.hao2046.net 文件夹 WScript.Echo "1. 启动 wget下载网站所有页面到本脚本目录的 720.hao2046.net 文件夹 ……" wso.Run "wget -r -p -k -c -x -A=jpg,htm,html 720.hao2046.net -P """ & strMeDir & """", 1, True ' 扫描 720.hao2046.net 文件夹中所有文件 WScript.Echo "2. 扫描 720.hao2046.net 文件夹中所有文件 ……" Dim strFolderspec, strHTML, strURL Dim arr() : ReDim Preserve arr(0) strFolderspec = strMeDir & "\720.hao2046.net" Call ScanFolder(arr, strFolderspec) ' 建立正则表达式。 Dim regEx Set regEx = CreateObject("VBScript.RegExp") ' 建立正则表达式。 regEx.IgnoreCase = True ' 设置是否区分大小写。 regEx.Global = True ' 设置全局替换。 regEx.MultiLine = True ' 设置多行匹配模式 ' 查找所有文件 WScript.Echo "3. 读取 720.hao2046.net 文件夹中的所有网页,匹配图片 URL 地址 ……" For i = 0 To UBound(arr) If LCase(Right(arr(i),5)) = ".html" Or LCase(Right(arr(i),4)) = ".htm" Then ' 读取文件,匹配图片 URL 地址 strHTML = ReadPfile(arr(i), "gb2312") regEx.Pattern = "src=['""]http://\S+\.jpg['""]" Set Matches = regEx.Execute(strHTML) ' 执行搜索。 For Each Match in Matches ' 遍历匹配集合。 If Not Match.Value = "" Then regEx.Pattern = "(src=['""])*(['""])*" strURL = strURL & regEx.Replace(Match.Value, "") & vbCrLf End If Next End If Next ' 保存所有图片 URL 地址 WScript.Echo "4. 保存所有图片 URL 地址到 url-img.txt 文件 ……" Call SavePfile(strMeDir & "\url-img.txt", "utf-8", strURL) ' 启动 wget 下载图片到本脚本 img 目录 WScript.Echo "5. 启动 wget 下载 url-img.txt 指定的图片到本脚本 img 目录 ……" wso.Run "wget -c -x -t 5 -i """ & strMeDir & "\url-img.txt"" -P """ & strMeDir & "\img""", 1, True Msgbox "完成!" End Sub '=========================================================================================== '按编码读取txt文件内容 Function ReadPfile(ByVal FileName, ByVal FileCode) Dim objStream Set objStream = CreateObject("ADODB.Stream") ' With objStream .Type = 2 .Mode = 3 .open .Charset = FileCode '不同编码时自己换,Chinese (Simplified) (GB2312),中文 GBK ,繁体中文 Big5 ,日文 EUC-JP ,韩文 EUC-KR,charset=UTF-8(国际化编码),ANSI,Unicode,unicode big endian .LoadFromFile FileName ReadPfile = .ReadText .Close End With Set objStream = Nothing End Function '=========================================================================================== '保存文件为unicode格式文本 Function SavePfile(ByVal FileName, ByVal FileCode, ByVal TextString) Dim objStream Set objStream = CreateObject("ADODB.Stream") With objStream .Type = 2 .Mode = 3 .Charset = FileCode '不同编码时自己换,Chinese (Simplified) (GB2312),中文 GBK ,繁体中文 Big5 ,日文 EUC-JP ,韩文 EUC-KR,charset=UTF-8(国际化编码),ANSI,Unicode,unicode big endian .open .WriteText TextString .SaveToFile FileName, 2 .Close End With Set objStream = Nothing End Function ' Dim arr() : ReDim Preserve arr(0) ' Call ScanFolder(arr, "V:\") Sub ScanFolder(ByRef arr, ByVal strFolderspec) On Error Resume Next Dim fso, objFolder Set fso = Createobject("Scripting.FileSystemObject") Set objFolder = fso.getfolder(strFolderspec) ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = strFolderspec & "\" For Each subFile In objFolder.files ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = subFile.path Next For Each subFolder In objFolder.subfolders ScanFolder arr, subFolder.path Next Set fso = NoThing Set objFolder = NoThing End Sub
附网页文件查找字符串代码(findstr_html.vbs):
' findstr_html.vbs Call Main() Sub Main() ' CMD 模式 If Not (LCase(Right(WScript.FullName,11)) = LCase("CScript.exe")) Then CreateObject("WScript.Shell").Run "cscript.exe //nologo """ & WScript.ScriptFullName & """", 1, False WScript.Quit(1) End If Dim strMeDir strMeDir = Left(WScript.ScriptFullName, InStrRev(WScript.ScriptFullName,"\")-1) Dim regEx, strHTML, strURL ' 扫描文件夹 Dim arr() : ReDim Preserve arr(0) Call ScanFolder(arr, strMeDir & "\720.hao2046.net") If UBound(arr) = 0 Then WScript.Echo strMeDir & "\720.hao2046.net" & ", Not Found!" Exit Sub End If ' 建立正则表达式。 Set regEx = CreateObject("VBScript.RegExp") ' 建立正则表达式。 regEx.IgnoreCase = True ' 设置是否区分大小写。 regEx.Global = True ' 设置全局替换。 regEx.MultiLine = True ' 设置多行匹配模式 Do strPattern = InputBox("请输入要匹配的正则表达式:","查找所有网页文件","123456") strInfo = strPattern & vbCrLf & "Not Found!" For i = 0 To UBound(arr) If LCase(Right(arr(i),5)) = ".html" Or LCase(Right(arr(i),4)) = ".htm" Then 'WScript.Echo arr(i) strHTML = ReadPfile(arr(i), "gb2312") If InStr(strHTML, strPattern)>0 Then strInfo = strPattern & vbCrLf & arr(i) & vbCrLf Exit For Else 'regEx.Pattern = "src=['""]http://\S+\.jpg['""]" regEx.Pattern = strPattern Set Matches = regEx.Execute(strHTML) ' 执行搜索。 For Each Match in Matches ' 遍历匹配集合。 If Not Match.Value = "" Then 'regEx.Pattern = "(src=['""])*(['""])*" 'strURL = strURL & regEx.Replace(Match.Value, "") & vbCrLf strInfo = strPattern & vbCrLf & arr(i) & vbCrLf Exit For End If Next End If End If Next WScript.Echo strInfo Loop End Sub '=========================================================================================== '按编码读取txt文件内容 Function ReadPfile(ByVal FileName, ByVal FileCode) Dim objStream Set objStream = CreateObject("ADODB.Stream") ' With objStream .Type = 2 .Mode = 3 .open .Charset = FileCode '不同编码时自己换,Chinese (Simplified) (GB2312),中文 GBK ,繁体中文 Big5 ,日文 EUC-JP ,韩文 EUC-KR,charset=UTF-8(国际化编码),ANSI,Unicode,unicode big endian .LoadFromFile FileName ReadPfile = .ReadText .Close End With Set objStream = Nothing End Function ' Dim arr() : ReDim Preserve arr(0) ' Call ScanFolder(arr, "V:\") Sub ScanFolder(ByRef arr, ByVal strFolderspec) On Error Resume Next Dim fso, objFolder Set fso = Createobject("Scripting.FileSystemObject") Set objFolder = fso.getfolder(strFolderspec) ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = strFolderspec & "\" For Each subFile In objFolder.files ReDim Preserve arr(UBound(arr)+1) arr(UBound(arr)) = subFile.path Next For Each subFolder In objFolder.subfolders ScanFolder arr, subFolder.path Next Set fso = NoThing Set objFolder = NoThing End Sub
提示:
1. 警告:请不要直接运行代码,这里的示范网址可能无法访问、或缺乏安全性,请改为其他网址再使用。
2. 请将 wget.exe 放置于脚本同一目录下,然后执行。文件结构如下:
..\wget.exe
..\wget_img.vbs
..\findstr_html.vbs
标签:
vbs,wget,下载,图片
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件!
如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
暂无“vbs结合wget 实现下载网站图片”评论...
RTX 5090要首发 性能要翻倍!三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。
首次推出的GDDR7内存模块密度为16GB,每个模块容量为2GB。其速度预设为32 Gbps(PAM3),但也可以降至28 Gbps,以提高产量和初始阶段的整体性能和成本效益。
据三星表示,GDDR7内存的能效将提高20%,同时工作电压仅为1.1V,低于标准的1.2V。通过采用更新的封装材料和优化的电路设计,使得在高速运行时的发热量降低,GDDR7的热阻比GDDR6降低了70%。
更新动态
2024年11月23日
2024年11月23日
- 凤飞飞《我们的主题曲》飞跃制作[正版原抓WAV+CUE]
- 刘嘉亮《亮情歌2》[WAV+CUE][1G]
- 红馆40·谭咏麟《歌者恋歌浓情30年演唱会》3CD[低速原抓WAV+CUE][1.8G]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[320K/MP3][193.25MB]
- 【轻音乐】曼托凡尼乐团《精选辑》2CD.1998[FLAC+CUE整轨]
- 邝美云《心中有爱》1989年香港DMIJP版1MTO东芝首版[WAV+CUE]
- 群星《情叹-发烧女声DSD》天籁女声发烧碟[WAV+CUE]
- 刘纬武《睡眠宝宝竖琴童谣 吉卜力工作室 白噪音安抚》[FLAC/分轨][748.03MB]
- 理想混蛋《Origin Sessions》[320K/MP3][37.47MB]
- 公馆青少年《我其实一点都不酷》[320K/MP3][78.78MB]
- 群星《情叹-发烧男声DSD》最值得珍藏的完美男声[WAV+CUE]
- 群星《国韵飘香·贵妃醉酒HQCD黑胶王》2CD[WAV]
- 卫兰《DAUGHTER》【低速原抓WAV+CUE】
- 公馆青少年《我其实一点都不酷》[FLAC/分轨][398.22MB]
- ZWEI《迟暮的花 (Explicit)》[320K/MP3][57.16MB]