孤独的一个孩子

发简信

孤独的一个孩子

2
关注
0
粉丝
0
文章
0

字数
0

收获喜欢
1

总资产

IP属地：加州

孤独的一个孩子

大佬，这个手机端的url你怎么抓到的，我用fiddler根本抓不到啊，找了半天就没有找到

美团外卖爬虫
接到一个新的任务，是根据城市名，爬取美团外卖的商户电话联系方式先去分析美团外卖的网站，https://waimai.meituan.com/，可是并没有任何商家的信息，后来...

sonic的简书
16458 13 4
孤独的一个孩子

无头浏览器模拟登陆遇到滑块过不去，进行js注入改变特征值但是没有效果，但是，有界面的情况下就能过

Puppeteer-无头浏览器简介
Puppeteer是什么 Puppeteer 是一个 Node 库，它提供了高级的 API 并通过 DevTools 协议来控制 Chrome(或Chromium)。通俗来说...

DC_er
1580 1 1

孤独的一个孩子

Selenium手册
王南北丶编，7 篇文章，52 人关注
孤独的一个孩子

我今天写了淘宝登陆，好几个地方用了页面显示等待，就是定位不到元素，给多长时间都没用，头都大了

Selenium笔记（7）常见的坑
本文集链接：https://www.jianshu.com/nb/25338984 1. 用Xpath查找数据时无法直接获取节点属性通常在我们使用xpath时，可以使用@c...

王南北丶
7776 6 3
孤独的一个孩子

@小温侯就这个登陆模块我走了不少弯路，一开始是觉得用selenium能方便一点，然后尝试了发现滑动验证始终过不去，后来，看了一篇文章就学着别人用pyppeteer实现，确实成功了，但是太繁琐了，用不惯，后来了解到selenium也可以通过代理，比如mitmproxy，或者fiddler拦截相关的js请求，并修改相关js代码，我尝试确实可以，原理都一样，都是让淘宝检测不到属于那些测试用的浏览器特有的预定义的js变量值，但是昨天我发现有大神用了个更简单的办法，使用selenium的时候，设置以下浏览器的选项，开启开发者模式，成功绕开了检测，好神奇啊，但是，总觉得用这些测试工具，要是搭建个cookie池显得好笨重啊，想着分析登陆接口，但是如果出现滑动验证就不好过了，对我来说实在是太难了，js水平有限，现在的爬虫感觉遇到瓶颈期了，没啥突破的感觉，大神有什么建议呢，是不是得要好好学js才行吗

模拟淘宝登陆获取初始Cookie
思路还记的上一篇文章里使用的Cookie吗？由于每次登陆淘宝的Cookie都不一样，所以每次都要手动登陆获取新的Cookie。这里我想研究一下怎样用程序获取这个Cookie...

小温侯
18422 13 15 1
孤独的一个孩子

@煎炼我晚上再去看看怎么解决，大佬，这个模拟登陆能不能不用测试工具实现，完全代码可以模拟登陆吗

淘宝爬虫之登陆验证（二）
淘宝作为一大电商网站，反爬措施还是相当的完善的，在我的文章中淘宝爬虫之登陆验证（一）是以cookie验证的，这次用selenium模拟登陆，用过selenium登陆淘宝...

煎炼
18200 25 17
孤独的一个孩子

这几天被这个东西搞吐了，总结以下，最终的解决方案有两种，一是坚持使用selenium的，那就使用代理，修改js文件，二是使用pyppeteer替代selenium，但是还是需要写js代码修改

淘宝爬虫之登陆验证（二）
淘宝作为一大电商网站，反爬措施还是相当的完善的，在我的文章中淘宝爬虫之登陆验证（一）是以cookie验证的，这次用selenium模拟登陆，用过selenium登陆淘宝...

煎炼
18200 25 17

孤独的一个孩子

淘宝爬虫之自动登录
最近在做一些淘宝数据的定时抓取demo参考github，关于定时任务的设置上一篇已经介绍过:APScheduler定时任务框架的使用，作为亚洲第一大电商平台，淘宝的反爬机制是...

若小北00
32733 26 21
孤独的一个孩子

若小北00
写了 29892 字，被 118 人关注，获得了 207 个喜欢

行者-坚持梦想，不断前行！<br><br>iOS-Ant-Bang互助社区 426981364<br>gitHub：<a href="https://links.jianshu.com/go?to=https%3A%2F%2Fgithub.com%2FRunning2snail" target="_blank">https://github.com/Running2snail</a>
孤独的一个孩子

小温侯
写了 110452 字，被 296 人关注，获得了 788 个喜欢

In theory there is no difference between theory and practice. In practice there is.
孤独的一个孩子

@小温侯据说淘宝可以检测到selenium爬虫，我之前看过有人介绍过，所以上手的时候就没有通过selenium去模拟登陆，而是采用pyppeteer，注入js，让淘宝无法识别到是浏览器爬虫，倒是不知道selenium可不可以修改js，你可以看看

模拟淘宝登陆获取初始Cookie
思路还记的上一篇文章里使用的Cookie吗？由于每次登陆淘宝的Cookie都不一样，所以每次都要手动登陆获取新的Cookie。这里我想研究一下怎样用程序获取这个Cookie...

小温侯
18422 13 15 1
孤独的一个孩子