解决淘宝登陆反爬

    首先,一切使用自动化框架的项目,或者说代码,或者说爬虫都会碰到某些网站刚刚打开页面就被判定为:非人类行为。为啥??

----------因为很多网站有对selenium的js监测机制。比如:navigator.webdriver,navigator.languages,navigator.plugins.length......很多很多。

比如美团,大众,淘宝这些'无良'商家。。就有对window.navigator.webdriver的检测机制。正常情况下---->​



window.navigator.webdriver的值为undefined。

而当我们使用selenium 的时候---->

window.navigator.webdriver的值为True。

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------

主要说下破解的两种办法。第一张使用mitmproxy用中间人的方式截取服务器发送来的js,修改js里面函数的参值方式发送给服务器。相当于在browser和server之间做一层中介的拦截。不过此方法要对js非常熟悉的人才好实施。

第二种方法依旧通过selenium,不过是在服务器在第一次发送js并在本地验证的时候,做好‘第一次’的伪装,从而实现‘第一次登陆’有效。。方法简单,适合小白。

我们用第二种方式来实现淘宝的登陆吧------------------>

pyppeteer 加 asyncio 绕过selenium检测,实现鼠标滑动后自动登陆(代码很简单。主要熟悉异步模块及pyppeteer模块。pyppeteer模块看不懂就去看puppeteer文档,pyppeteer只是在puppeteer之上稍微包装了下而已 )。

1.main_py 文件作为主要运行的py:

import asyncio

import time

from pyppeteer.launcher import launch

from alifunc import mouse_slide, input_time_random

from exe_js import js1, js3, js4, js5

async def main(username, pwd, url):

    browser = await launch({'headless': False, 'args': ['--no-sandbox'], })

    page = await browser.newPage()

    await page.setUserAgent(

        'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36 Edge/16.16299')

    await page.goto(url)

    await page.evaluate(js1)

    await page.evaluate(js3)

    await page.evaluate(js4)

    await page.evaluate(js5)

    await page.type('.J_UserName', username, {'delay': input_time_random() - 50})

    await page.type('#J_StandardPwd input', pwd, {'delay': input_time_random()})

    await page.screenshot({'path': './headless-test-result.png'})

    time.sleep(2)

    slider = await page.Jeval('#nocaptcha', 'node => node.style')  # 是否有滑块

    if slider:

        print('出现滑块情况判定')

        await page.screenshot({'path': './headless-login-slide.png'})

        flag = await mouse_slide(page=page)

        if flag:

            await get_cookie(page)

    else:

        await page.keyboard.press('Enter')

        await page.waitFor(20)

        await page.waitForNavigation()

        try:

            global error

            error = await page.Jeval('.error', 'node => node.textContent')

        except Exception as e:

            error = None

        finally:

            if error:

                print('确保账户安全重新入输入')

                # 程序退出。

                loop.close()

            else:

                print(page.url)

                await get_cookie(page)

# 获取登录后cookie

async def get_cookie(page):

    res = await page.content()

    cookies_list = await page.cookies()

    cookies = ''

    for cookie in cookies_list:

        str_cookie = '{0}={1};'

        str_cookie = str_cookie.format(cookie.get('name'), cookie.get('value'))

        cookies += str_cookie

    print(cookies)

    return cookies

if __name__ == '__main__':

    username = 'xxxxxxxxxxxxx'

    pwd = 'xxxxxxx'

    url = 'https://login.taobao.com/member/login.jhtml?style=mini&css_style=b2b&from=b2b&full_redirect=true&redirect_url=https://login.1688.com/member/jump.htm?target=https://login.1688.com/member/marketSigninJump.htm?Done=http://login.1688.com/member/taobaoSellerLoginDispatch.htm&reg= http://member.1688.com/member/join/enterprise_join.htm?lead=http://login.1688.com/member/taobaoSellerLoginDispatch.htm&leadUrl=http://login.1688.com/member/'

    loop = asyncio.get_event_loop()

    loop.run_until_complete(main(username, pwd, url))

2 exe_js 需要伪装js数据的py文件,alifunc出现滑块情况下进行鼠标移动的py文件。

# alifunc.py

from retrying import retry

import time, asyncio, random

def retry_if_result_none(result):

    return result is None

@retry(retry_on_result=retry_if_result_none,)

async def mouse_slide(page=None):

    await asyncio.sleep(3)

    try:

        await page.hover('#nc_1_n1z')

        await page.mouse.down()

        await page.mouse.move(2000, 0, {'delay': random.randint(1000, 2000)})

        await page.mouse.up()

    except Exception as e:

        print(e, '    :slide login False')

        return None

    else:

        await asyncio.sleep(3)

        slider_again = await page.Jeval('.nc-lang-cnt', 'node => node.textContent')

        if slider_again != '验证通过':

            return None

        else:

            await page.screenshot({'path': './headless-slide-result.png'})

            print('验证通过')

            return 1

def input_time_random():

    return random.randint(100, 151)

# exe_js.py

js1 = '''() =>{


          Object.defineProperties(navigator,{

            webdriver:{

              get: () => false

            }

          })

        }'''

js2 = '''() => {

        alert (

            window.navigator.webdriver

        )

    }'''

js3 = '''() => {

        window.navigator.chrome = {

    runtime: {},

    // etc.

  };

    }'''

js4 = '''() =>{

Object.defineProperty(navigator, 'languages', {

      get: () => ['en-US', 'en']

    });

        }'''

js5 = '''() =>{

Object.defineProperty(navigator, 'plugins', {

    get: () => [1, 2, 3, 4, 5,6],

  });

        }'''

---------------------------------------------------------------------

运行结果

代码下载地址:

https://github.com/chenchong6/taobao-login

puppeteer文档地址:

https://zhaoqize.github.io/puppeteer-api-zh_CN/#/?id=%E6%A6%82%E8%BF%B0

async/await 速看:

https://python.freelycode.com/contribution/detail/57

pyppeteer地址:

https://github.com/miyakogi/pyppeteer

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 156,907评论 4 360
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 66,546评论 1 289
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 106,705评论 0 238
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 43,624评论 0 203
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 51,940评论 3 285
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,371评论 1 210
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,672评论 2 310
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,396评论 0 195
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,069评论 1 238
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,350评论 2 242
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 31,876评论 1 256
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,243评论 2 251
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 32,847评论 3 231
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,004评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,755评论 0 192
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,378评论 2 269
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,266评论 2 259