借用Automator批量下载头像的方法(完善篇)

上篇文章的最后说要解决的几个问题通过一个下午的折腾终于搞定了。

先放程序,需要的拿走,后面会讲解实现思路与遇到的坑

百度云:https://pan.baidu.com/s/1o8dNQxc
Github:https://github.com/pangwu86/AutomatorCollection

程序使用前必要设置

由于程序需要控制Safari浏览器进行一定的操作,所以需要开启Safari中“允许Apple事件中的javascript”功能,具体操作步骤如下:

  1. 开启Safari浏览器的开发者模式,在偏好设置中,“高级”界面最下方勾选中即可。
  2. 勾选“允许Apple事件中的javascript”,在菜单栏中“开发”下,保持其为勾选状态,这里是需要用户输入密码的。

否者的话在运行过程中就会弹出下面的提示了

实现自动打开页面并下载图片

先分解下整个实现的过程:

  1. 新建文件夹以便后面保存下载图片。这里文件夹采用“头像”+“当前时间”来进行命名,这样可以保证每次生成的目录都不会重名
  2. 打开浏览器,并打开指定的页面。这里是唤起Safari浏览器,因为系统默认自带,而且Automator也是对Safari有相关操作的支持
  3. 控制页面不断向下滚动加载更多图片。默认首页只有十几张图片远远不够用,所以需要多加载一些出来。
  4. 解析页面中图片地址。
  5. 下载图片到指定文件夹中

之后的操作就是上篇文章的内容了,直接将相关操作加到后面即可。

接下来说一下实现过程中的难点

浏览器的相关控制

mac系统中可以通过AppleScript脚本对系统中的程序进行一定的控制。

打开浏览器并打开页面:

on run
    tell application "Safari" to open location "http://image.baidu.com/search/index?tn=baiduimage&ps=1&lm=-1&cl=2&nc=1&ie=utf-8&word=头像"
end run

打开页面地址其实可以通过变量进行设置,而且这个变量也可以通过系统的剪切板进行设置,这样就可以修改成一个更加通用的图片下载工具。

不过这里为了能达到“一键下载”的功能所以将地址直接写在了脚本中。

为了能看到接下来的操作,还加上了将浏览器切换到前台的操作:

tell application "System Events"
    set frontmost of process "Safari" to true
    keystroke "1" using command down
    delay 0.2
end tell

页面的相关控制

在需要加载更多图片的时候要将页面不停的向下滚动,这里就是靠javascript来控制滚动条不断的移动到底部从而达到目的。

实现滚动条到底的js脚本非常简单,这里封装了一个方法:

function gotoBottom() {
    var $mybody = document.body;
    $mybody.scrollTop = $mybody.scrollHeight
}

Automator中调用js有一些特别的写法与限制,首先需要一个run方法,是否有传入参数可以根据Automator中的设置来定

function run(){
    // 脚本内容
    var scriptText = "";
   
    // safari中执行
    var Safari = Application('Safari');
    var cutab = Safari.windows[0].currentTab;
    Safari.doJavaScript(scriptText, {in: cutab});
}

这里Safari.doJavaScript是有返回值的,后面会详细再说。

这里scriptText需要将js代码进行拼接,所以推荐现在其他地方写好并测试通过后在加到Automator中。
最终这里实现了一个连续调用20次滚动到底的操作的代码:

function run(input){
    // 向下滚动脚本
    var scriptText = "";
    scriptText += 'var _gbTimer = null;';
    scriptText += 'var _gbCount = 0;';
    scriptText += 'var _gbMax = 20;';
    scriptText += 'var $mybody = document.body;';
    scriptText += 'function gotoBottom(){$mybody.scrollTop = $mybody.scrollHeight};';
    scriptText += '_gbTimer = setInterval(function(){if(_gbCount < _gbMax){gotoBottom(); _gbCount++} else {clearInterval(_gbTimer)}}, 200);';

    // safari中执行
    var Safari = Application('Safari');
    var cutab = Safari.windows[0].currentTab;
    Safari.doJavaScript(scriptText, {in: cutab});
}

获取图片url的坑

这里本来是使用Automator自带的方法来解析页面中图片地址的

但经过测试发现,该操作最后得到的图片地址只有页面刚刚加载完成时的那些,通过滚动到底部加载的图片并没有被解析到。

后来发现该操作的输入的参数是网页的url,也就是说其他它的内部实现其实是“通过一个内置的浏览器打开对应url,然后解析页面中的图片地址”,所以跟我们之前打开的浏览器窗口没有半毛钱关系,也就无法拿到下面加载出来的图片地址了。

所以这里继续采用javascript的方式来获取页面的图片地址。

实现一个js方法获取图片的地址并放到一个数组里,然后返回到Automator:

function run(){

    // 获取图片数量
    var scriptText = "";
    scriptText += 'function allImages(){';
    scriptText += ' var imgs = [];';
    scriptText += ' var $imgs = document.getElementsByTagName("img");';
    scriptText += ' var imax = $imgs.length;';
    scriptText += ' for(var i=0;i<imax;i++){imgs.push($imgs[i].src);console.log($imgs[i].src)}';
    scriptText += ' console.log("hasimg:" + imgs.length);';
    scriptText += ' return imgs;';
    scriptText += '};';
    scriptText += 'allImages();';

    // safari中执行
    var Safari = Application('Safari');
    var cutab = Safari.windows[0].currentTab;
    var allimgs = Safari.doJavaScript(scriptText, {in: cutab});
    return allimgs;
}

虽然Safari.doJavaScript是可以有返回值的,但上述写法却始终拿不到。
经过测试发现Safari.doJavaScript执行那种直接返回内容的脚本可以,对于执行方法的返回值无效,所以修改后的脚本如下:

function run(){ 

    // safari中执行
    var Safari = Application('Safari');
    var cutab = Safari.windows[0].currentTab;
    var imgs = [];
    var scriptText = 'document.getElementsByTagName("img").length';
    var imax = Safari.doJavaScript(scriptText, {in: cutab});
    for (var x = 0; x < imax; x++) {
        scriptText = 'document.getElementsByTagName("img")[' + x + '].src';
        imgs.push(Safari.doJavaScript(scriptText, {in: cutab}));
    }
    return imgs;
}

最终成功拿到了页面中所有图片的地址。

接着就是使用Automator自带的图片过滤与下载功能了

最后总结

最终的程序如下:

虽然看着步骤很多,但其实每一步操作都只做了一件事情。

一个本来看上去很复杂的工作也就这样被层层分解为了一件件小工作,这才是最常见也最有效的解决问题之道呀。

最后说一句,Automator真的很强大,熟练掌握以后真的是可以做到事半功倍了。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 161,192评论 4 369
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 68,186评论 1 303
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 110,844评论 0 252
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,471评论 0 217
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,876评论 3 294
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,891评论 1 224
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 32,068评论 2 317
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,791评论 0 205
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,539评论 1 249
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,772评论 2 253
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,250评论 1 265
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,577评论 3 260
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,244评论 3 241
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,146评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,949评论 0 201
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,995评论 2 285
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,812评论 2 276

推荐阅读更多精彩内容

  • 问答题47 /72 常见浏览器兼容性问题与解决方案? 参考答案 (1)浏览器兼容问题一:不同浏览器的标签默认的外补...
    _Yfling阅读 13,634评论 1 92
  • WebSocket-Swift Starscream的使用 WebSocket 是 HTML5 一种新的协议。它实...
    香橙柚子阅读 22,997评论 8 183
  • 很多朋友对于购买保险觉得很没用,因此拒绝的理由一般就是那么几种:最近没时间,考虑一下再说,不需要,大病不会赶上我的...
    妙衣童阅读 266评论 0 0
  • 我的车是一辆小巧的黑白色的电动自行车,是我很久以来很喜欢也很需要的类型车,可是昨天它就不能用,才2个星期不到呢,念...
    晨曦_13ef阅读 206评论 0 0